设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 编程语言专区 › Python交流 › 爬虫状态码418怎么破

发新帖

查看: 3632|回复: 2

[已解决]爬虫状态码418怎么破

发表于 2020-3-7 08:15:15 | 显示全部楼层 |阅读模式

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
from bs4 import BeautifulSoup
from urllib import request
url='https://movie.douban.com/top250'
a=requests.get(url)
print(a.status_code)

复制代码

代码如上图

最佳答案

月排行榜 / 总排行榜

zltzlt

2020-3-7 08:17:40

加一个 headers，不让网站认为你是爬虫

import requests
from bs4 import BeautifulSoup
from urllib import request
url = 'https://movie.douban.com/top250'
a = requests.get(url, headers={"User-Agent": "Mozilla/5.0"})
print(a.status_code)

复制代码

跳转到最佳答案楼层

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发表于 2020-3-7 08:17:40 | 显示全部楼层本楼为最佳答案

这个最佳答案由 zltzlt 给出，感谢 zltzlt 的回答。

单击隐藏图章

加一个 headers，不让网站认为你是爬虫

import requests
from bs4 import BeautifulSoup
from urllib import request
url = 'https://movie.douban.com/top250'
a = requests.get(url, headers={"User-Agent": "Mozilla/5.0"})
print(a.status_code)

复制代码

小甲鱼最新课程 -> https://ilovefishc.com

回复支持反对

使用道具举报

楼主| 发表于 2020-3-7 08:22:21 | 显示全部楼层

zltzlt 发表于 2020-3-7 08:17
加一个 headers，不让网站认为你是爬虫

感谢

小甲鱼最新课程 -> https://ilovefishc.com

回复支持反对

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-5-28 19:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表