鱼C论坛

 找回密码
 立即注册
查看: 1539|回复: 4

正则获取淘宝数据慢

[复制链接]
发表于 2020-8-26 15:47:21 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位大佬,小弟在用selenium获取淘宝一页的数据(有800k,80多万个英文字母/40多万个中文字母),有48个店铺信息,用正则获取每个店铺信息,发现正则的获取速度很慢,怎么解决!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-8-26 16:11:42 | 显示全部楼层

换个解析方式
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-26 17:18:39 | 显示全部楼层
用xpath试试?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-26 19:32:16 | 显示全部楼层
不是光是解析方式的问题,是selenium本身就不高效
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-27 08:59:26 | 显示全部楼层
用Request找不到淘宝的网址,我现在还不会Scrapy,只能用Selenium来操作.
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-19 03:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表