[已解决]python爬虫有关xpath的问题，爬虫初学者

suchocolate · 发表于 2020-4-1 16:48:07

不加头拿不到数据
headers = {'user-agent':'firefox'}
data = requests.get(url, headers=headers).text

suchocolate · 发表于 2020-4-6 12:18:36

冲动小郭发表于 2020-4-1 22:46
！！不好意思，不用您的解答了，我查询了有关的书了。

没事，我之前回答的也不够准确。
如果不写头的话，默认user-agent是python-requests/x.x，网站一看是爬虫就拒绝了，所以应该写头。
以下是我用wireshark抓的一次requests.get在不写头的情况下发的包的内部字段，红线这里就是他的默认user-agent。

登录/注册后可看大图

账号		自动登录	找回密码
密码			立即注册