爬虫解析库
python爬虫的解析库诸如bs4, PyQuery, lxml这些哪个是最灵活,最精准的? 各有优缺,我比较喜欢lxml 本帖最后由 Py与C。。。 于 2021-5-28 20:09 编辑只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快,抓取数据快捷,但是有些难理解,当需要匹配的内容有很多的时候,使用正则表达式提取目标信息会导致程序运行的速度减慢,需要消耗更多内存。
lxml和PyQuery都很快,比较灵活,但不如bs4好上手
根据需要,如果只是提取少量重要数据,建议使用正则;
如果不需要很快话,bs4完全可以满足;
lxml和pyquery提取东西很方便,在大多情况下建议使用他们(我也很喜欢用) 不存在哪个,适用于自己的就是好的 Py与C。。。 发表于 2021-5-28 19:59
只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快, ...
谢谢
页:
[1]