鱼C论坛

 找回密码
 立即注册
查看: 943|回复: 6

如何使用python爬取某宝/天猫商品评论数据(小剂量,非商用)

[复制链接]
发表于 2020-4-12 13:31:32 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
淘宝/天猫商品数据的爬取和分析,非商用,评论里找
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-12 13:41:26 | 显示全部楼层
这个...有点nan
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-12 13:47:42 | 显示全部楼层
请参考这个帖子戳我前进
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-12 14:32:53 | 显示全部楼层
小甲鱼写的那个爬取淘宝数据改改就可以用了。如果要评论数据的话,我可以给一些参考的接口和参数。
天猫:https://rate.tmall.com/list_detail_rate.htm
参数:        par = {
            "itemId": ,  #商品id
            "sellerId": ,    # 店铺id
            "currentPage": ,   # 评论页数
            "callback": , # jsonp加三个数字
            "order": "3"  # 排序方式
            }

淘宝:https://rate.taobao.com/feedRateList.htm
参数:        par = {
            "auctionNumId": ,   
            "userNumId": ,
            "currentPageNum": ,
            "callback": "jsonp_tbcrate_reviews_list",
            "orderType": "sort_weight"
            }
淘宝也差不多。挺麻烦的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-12 14:57:33 | 显示全部楼层
这个。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-12 21:12:48 | 显示全部楼层
现在某宝某猫 都是反爬的经典网站 不是JS加密 就是JS渲染 获取数据有点难度 但是你可以上selenium看一下 以前我用这个库爬过 数据是能拿到的 但是就是速度上有点慢

如果确定是JS渲染的话 可以直接上框架pyspider 速度快  挂在服务器上 爬个一天一夜基本上想要的数据都有
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-4-13 14:14:42 | 显示全部楼层
heidern0612 发表于 2020-4-12 13:47
请参考这个帖子戳我前进

谢谢,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-26 10:20

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表