[已解决]请问python爬虫教学实战里面爬猫图的问题

Cris_From_St.Pe · 发表于 2020-2-5 15:21:58

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

按照小甲鱼的代码敲了一边系统一直在运行跳不出去是为啥？
import urllib.request
responece= urllib.request.urlopen("http://placekitten.com/g/300/500")
File = responece.read()
with open('cat_300_500.jpg','wb') as f:
f.write(File)

最佳答案

月排行榜 / 总排行榜

dlnb526

2020-2-6 16:31:40

import urllib.request
req = urllib.request.Request("http://placekitten.com/g/300/500")
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.85 Safari/537.36 Edg/80.0.361.47')
response = urllib.request.urlopen(req)
File = response.read()
with open('cat_300_500.jpg','wb') as f:
f.write(File)

复制代码

应该是服务器这两天加了反爬虫，我前两天能用的程序也爬不了了，你还是加个header吧

跳转到最佳答案楼层

qiuyouzhi · 发表于 2020-2-6 15:58:01

本帖最后由 qiuyouzhi 于 2020-2-6 16:02 编辑

这个网页都访问不了

wp231957 · 发表于 2020-2-6 16:01:58

qiuyouzhi 发表于 2020-2-6 15:58
不是啊，程序早就跳出来了
是因为它的执行结果没有在IDLE里面有显示，而是直接拷下来了图片

连headers都没有，对方也给响应？？

qiuyouzhi · 发表于 2020-2-6 16:03:35

wp231957 发表于 2020-2-6 16:01
连headers都没有，对方也给响应？？

他是按照书来的
书上有headers？

qiuyouzhi · 发表于 2020-2-6 16:04:08

qiuyouzhi 发表于 2020-2-6 16:03
他是按照书来的
书上有headers？

我记得小甲鱼的视频里也没有吧

Stubborn · 发表于 2020-2-6 16:09:38

wp231957 发表于 2020-2-6 16:01
连headers都没有，对方也给响应？？

不是所有的网站，都会要求有请求头的

wp231957 · 发表于 2020-2-6 16:13:56

Stubborn 发表于 2020-2-6 16:09
不是所有的网站，都会要求有请求头的

10个网站，能通过一个都是多的

dlnb526 · 发表于 2020-2-6 16:31:40

这个最佳答案由 dlnb526 给出，感谢 dlnb526 的回答。

单击隐藏图章

import urllib.request
req = urllib.request.Request("http://placekitten.com/g/300/500")
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.85 Safari/537.36 Edg/80.0.361.47')
response = urllib.request.urlopen(req)
File = response.read()
with open('cat_300_500.jpg','wb') as f:
f.write(File)

复制代码

应该是服务器这两天加了反爬虫，我前两天能用的程序也爬不了了，你还是加个header吧

末影 · 发表于 2020-2-6 16:36:18

可以啊，我运行了一下，程序是可行的

Cris_From_St.Pe · 发表于 2020-2-7 10:17:47

dlnb526 发表于 2020-2-6 16:31
应该是服务器这两天加了反爬虫，我前两天能用的程序也爬不了了，你还是加个header吧

请问这个header要怎么找？所有的header都像您这么写吗？

账号		自动登录	找回密码
密码			立即注册