17623095765 发表于 2021-3-5 22:57:36

用requests() 爬闲鱼图片失败

import re,bs4,requests
q='https://market.m.taobao.com/app/idleFish-F2e/widle-taobao-rax/page-detail?wh_weex=true&wx_navbar_transparent=true&id=638370545589&ut_sk=1.XolsTIuL%252BJoDAOhG8M%252Bd%252BzT3_21407387_1614952739911.Copy.detail.638370545589.3396102355&forceFlush=1'

headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0'}
       
a=requests.get(q,headers=headers)

b=bs4.BeautifulSoup(a.text,'html.parser')

c=re.search(r'<img placeholder=".*src=.*\.jpg"',str(b))

问题出现在a.text这里,在网站中<body data-spm="12011849",而在requests中<body data-spm="page-detail"
从而导致里面的数据没办法显示出来,请问有什么办法能解决吗

逃兵 发表于 2021-3-6 10:42:13

这个网址会跳转到下载APP上
页: [1]
查看完整版本: 用requests() 爬闲鱼图片失败