鱼cpython学习者 发表于 2021-5-28 18:06:54

爬虫解析库

python爬虫的解析库诸如bs4, PyQuery, lxml这些哪个是最灵活,最精准的?

wp231957 发表于 2021-5-28 18:16:59

各有优缺,我比较喜欢lxml

Py与C。。。 发表于 2021-5-28 19:59:21

本帖最后由 Py与C。。。 于 2021-5-28 20:09 编辑

只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快,抓取数据快捷,但是有些难理解,当需要匹配的内容有很多的时候,使用正则表达式提取目标信息会导致程序运行的速度减慢,需要消耗更多内存。
lxml和PyQuery都很快,比较灵活,但不如bs4好上手
根据需要,如果只是提取少量重要数据,建议使用正则;
如果不需要很快话,bs4完全可以满足;
lxml和pyquery提取东西很方便,在大多情况下建议使用他们(我也很喜欢用)

不能懒 发表于 2021-5-28 21:01:05

不存在哪个,适用于自己的就是好的

鱼cpython学习者 发表于 2021-5-28 21:07:13

Py与C。。。 发表于 2021-5-28 19:59
只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快, ...

谢谢
页: [1]
查看完整版本: 爬虫解析库