|
发表于 2020-5-8 10:01:12
|
显示全部楼层
本帖最后由 颜栩栩 于 2020-5-8 10:03 编辑
可以尝试添加cookie和User-Agent在请求头中,cookie的获取方式见附件
- import requests
- url = 'http://item.jd.com/4643045.html'
- cookiestr='''这里放上你的cookie!!!'''
- headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.14 Safari/537.36 Edg/83.0.478.13","cookie":cookiestr}
- try:
- r = requests.get(url=url,headers=headers)
- r.raise_for_status()
- r.encoding = r.apparent_encoding
- print(r.text)
- except:
- print('爬取失败')
复制代码
cookie的获取方式:
https://item.jd.com/4643045.html进入这个页面后按F12,进入NETWORK这个标签,再刷新页面,可以看到NETWORK中出现了很多项!找到4643045.html这一项,即可获取cookie。
(为了保护隐私我打马了哈~)
|
|