鱼C论坛

 找回密码
 立即注册
查看: 1610|回复: 7

python爬虫时的头部header添加问题

[复制链接]
发表于 2018-11-13 01:09:30 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
问题:
用requests 库爬虫时,在headers头部添加 “Host”参数有什么作用?
添加和不添加,对返回结果的影响很大吗?(晚上被这一行代码浪费了6个小时找bug!!!!抓狂
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-11-13 02:27:54 | 显示全部楼层
HOST参数,是你访问的页面的主页地址,就比如这个页面,它的HOST就是fishc.com.cn
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-13 07:30:37 From FishC Mobile | 显示全部楼层
不是全部,有些网站查这个,为的是防盗链,同样还有headers里的后退也是一样道理。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-13 08:07:42 | 显示全部楼层
Host 头域:指定请求资源的Intenet主机和端口号
必须表示请求url的原始服务器或网关的位置
HTTP/1.1请求必须包含主机头域,否则系统会以400状态码返回
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-13 09:13:54 | 显示全部楼层
过来顶一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-13 10:58:26 | 显示全部楼层
什么网站啊??
爬取大多数都不需要host参数。
加了反而导致错误。
一般不需要添加该参数
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-13 11:03:52 | 显示全部楼层
过来顶一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-11-26 17:05:04 | 显示全部楼层
wongyusing 发表于 2018-11-13 10:58
什么网站啊??
爬取大多数都不需要host参数。
加了反而导致错误。

是的,我加了后访问错误,但是有些书上说加了不容易被反爬。。。。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-5 22:17

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表