大佬们,怎么在网页源代码里面提取自己想要的信息?
最近在家学习爬虫,但不知怎么从网页源代码中提取自己所需的信息望广大鱼油们帮助我,谢谢了
这范围太大,问问题也没这么问的吧 XPath,regex target = soup.find_all(标签名字) 正则,都行的 xiaosi4081 发表于 2020-5-23 19:40
target = soup.find_all(标签名字)
谢谢哦 去b站找Python爬虫教程,先学学数据提取
数据提取主要有这些:
正则表达式
Beautiful Soup
XPath
JsonPath
PyQuery
Scrapy、Selenium 也可以提取数据
具体怎么提取,你学了这些就自然懂得
页:
[1]