江湖也就酒还行 发表于 2020-6-7 10:42:36

代码中有add_header(),但还是被禁止访问网站了

56讲 跟着小甲鱼写爬取妹子图的代码时, 明明代码中是有add_header()的,但是运行时仍然返回了403错误
def url_open(url):
    req=urllib.request.Request(url)
   
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0')
    response=urllib.request.urlopen(url)
    html=response.read()


urllib.error.HTTPError: HTTP Error 403: Forbidden
这种情况应该怎么办? 求大佬解答

Twilight6 发表于 2020-6-7 10:49:32

我记得小甲鱼妹子图那个网站有反爬了

suchocolate 发表于 2020-6-7 11:04:32

为啥好多人的代码都是,明明构建了req,就是不调用,是不是都是抄的同一个错误的案例。
这句url改成req:
response=urllib.request.urlopen(req)

老八秘制 发表于 2020-6-7 11:11:02

换个网站

xiaosi4081 发表于 2020-6-9 07:39:50

def url_open(url):
    req=urllib.request.Request(url)
   
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0')
    response=urllib.request.urlopen(req)
    html=response.read()
页: [1]
查看完整版本: 代码中有add_header(),但还是被禁止访问网站了