鱼C论坛

 找回密码
 立即注册
查看: 1642|回复: 0

[作品展示] js动态加载--淘宝评论

[复制链接]
发表于 2019-4-14 04:06:33 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 Stubborn 于 2019-4-14 04:09 编辑

这里话不多说,接上一个帖子,用了一些jsonxpath的方法,抓取评论
  1. # -*- coding: utf-8 -*-
  2. # @Time    : 2019-04-08 00:08
  3. # @Author  : Ein
  4. # @File    : Jsonpath-淘宝评论.py
  5. # @Software: PyCharm
  6. import requests
  7. import jsonpath


  8. COOKIE = 'thw=cn; cna=MsgjFQjusQICATsqbz+EqQnp; t=f7dd5ba1920f8f8d1073a0578ddd191a; cookie2=11db44742a4b63d88b21b2d5865812d7; _tb_token_=e7f5495003e07; _cc_=V32FPkk%2Fhw%3D%3D; tg=0; enc=GeRVzabt5E1wETGR23fpBaRcJHDXCSf2TfqKH%2FSMRW9qqLMo7NAnamB0ogz%2B5dVVecYMMX%2BOyb67mCh%2Fn5OMiA%3D%3D; hng=CN%7Czh-CN%7CCNY%7C156; mt=ci=0_0; v=0; uc1=cookie14=UoTZ4Mn%2BO0mr1A%3D%3D; _m_h5_tk=26f291651bdf878bbacdd979958f0c28_1554672819450; _m_h5_tk_enc=e238ec088024e28c6f090baaa0e6865d; x5sec=7b22726174656d616e616765723b32223a223539363864363064373935353564626463383335393430366466373739616531434f796871655546454c72373776652f6a7375427851453d227d; isg=BIWF8Aqnda6nDlHELahBZUx2lMd_6jm89Rqi1IfqQbzLHqWQT5JJpBN8LAJNRVGM; l=bBEoNHAVv4TUzZ89BOCanurza77OSIRYYuPzaNbMi_5ZV6T1-Z_OlG8EVF96Vj5R_O8B4fxkHvv9-etbq'
  9. '''
  10. 接口:currentPageNum 翻页,pageSize 每页数量
  11. https://rate.taobao.com/feedRateList.htm?auctionNumId=521603418228&userNumId=651615231&currentPageNum=2&pageSize=20
  12. '''

  13. def main():
  14.     url = 'https://rate.taobao.com/feedRateList.htm?auctionNumId=521603418228&userNumId=651615231&currentPageNum=1&pageSize=20'
  15.     headers = {
  16.         'User - Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',
  17.         'Cookie':COOKIE
  18.     }
  19.     response = requests.get(url=url,headers=headers).text.strip('() \n\t\r')
  20.     #取出json格式字符串两边非法字符
  21.     response = json.loads(response)
  22.     comments_list = response['comments']
  23.     #抓取评论内容,头像,用户名,评论时间,套餐类型
  24.     #取出comments列表
  25.     for comments in comments_list:
  26.         avatar = 'https:'+jsonpath.jsonpath(comments,'$..avatar')[0] #头像
  27.         name = jsonpath.jsonpath(comments,'$..nick')#名字
  28.         comment = jsonpath.jsonpath(comments,'$..content') #评论内容
  29.         date = jsonpath.jsonpath(comments,'$..date')  #评论时间
  30.         info =jsonpath.jsonpath(comments,'$..sku') # 套餐类型
  31.         item = {
  32.             '头像':avatar,
  33.             '名字':name,
  34.             '评论内容':comment,
  35.             '评论时间':date,
  36.             '套餐类型':info
  37.         }
  38.     print(item)

  39. if __name__ == '__main__':
  40.     main()
复制代码

本帖被以下淘专辑推荐:

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-5-26 06:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表