鱼C论坛

 找回密码
 立即注册
查看: 1030|回复: 6

[已解决]HTTP状态码求助

[复制链接]
发表于 2020-1-20 12:41:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我在学爬虫的时候,用request模块爬了豆瓣电影排行榜,
却给我返回一个418状态码,请问这个418状态码是什么鬼?
附上代码:
  1. >>> import requests
  2. >>> res = requests.get("https://movie.douban.com/top250")
  3. >>> res.status_code
  4. 418
  5. >>>
复制代码
最佳答案
2020-1-20 13:11:10
需要加上 headers:

  1. >>> import requests
  2. >>> res = requests.get("https://movie.douban.com/top250", headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36}"})
  3. >>> res.status_code
  4. 200
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-1-20 12:44:32 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-1-20 12:47:19 | 显示全部楼层
我刚才查了一下,最多只有417
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-1-20 13:04:00 From FishC Mobile | 显示全部楼层
不加headers很少有返回成功的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-1-20 13:11:10 | 显示全部楼层    本楼为最佳答案   
需要加上 headers:

  1. >>> import requests
  2. >>> res = requests.get("https://movie.douban.com/top250", headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36}"})
  3. >>> res.status_code
  4. 200
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-1-20 13:17:56 From FishC Mobile | 显示全部楼层
以就如 1L 所说,你触发了反爬,微博的程序员就返回这个和你开个玩笑
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-1-20 13:20:14 | 显示全部楼层
感谢各位大佬,已经明白了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-19 11:05

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表