鱼C论坛

 找回密码
 立即注册
查看: 1861|回复: 4

[已解决]爬虫解析库

[复制链接]
发表于 2021-5-28 18:06:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
python爬虫的解析库诸如bs4, PyQuery, lxml这些哪个是最灵活,最精准的?
最佳答案
2021-5-28 19:59:21
本帖最后由 Py与C。。。 于 2021-5-28 20:09 编辑

只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快,抓取数据快捷,但是有些难理解,当需要匹配的内容有很多的时候,使用正则表达式提取目标信息会导致程序运行的速度减慢,需要消耗更多内存。
lxmlPyQuery都很快,比较灵活,但不如bs4好上手
根据需要,如果只是提取少量重要数据,建议使用正则;
如果不需要很快话,bs4完全可以满足;
lxml和pyquery提取东西很方便,在大多情况下建议使用他们(我也很喜欢用)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-5-28 18:16:59 From FishC Mobile | 显示全部楼层
各有优缺,我比较喜欢lxml
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-5-28 19:59:21 | 显示全部楼层    本楼为最佳答案   
本帖最后由 Py与C。。。 于 2021-5-28 20:09 编辑

只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快,抓取数据快捷,但是有些难理解,当需要匹配的内容有很多的时候,使用正则表达式提取目标信息会导致程序运行的速度减慢,需要消耗更多内存。
lxmlPyQuery都很快,比较灵活,但不如bs4好上手
根据需要,如果只是提取少量重要数据,建议使用正则;
如果不需要很快话,bs4完全可以满足;
lxml和pyquery提取东西很方便,在大多情况下建议使用他们(我也很喜欢用)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-5-28 21:01:05 | 显示全部楼层
不存在哪个,适用于自己的就是好的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-5-28 21:07:13 | 显示全部楼层
Py与C。。。 发表于 2021-5-28 19:59
只能说各有千秋吧,如果非要说的话,
bs4比较好爬(好理解),但是速度有点慢,而且方法很难记
正则快, ...

谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-15 17:13

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表