鱼C论坛

 找回密码
 立即注册
查看: 2515|回复: 9

[已解决]爬图爬出的图片打不开

[复制链接]
发表于 2020-5-25 21:19:44 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import re
import requests
import os
from bs4 import BeautifulSoup as bs
header= {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3314.0 Safari/537.36 SE 2.X MetaSr 1.0',
                     'Referer':'https://www.mzitu.com/japan/'}
a='http://info.xitek.com/galleries/'
b=requests.get(a, headers=header).content.decode('utf-8')
print(b)
d=re.findall(r'//info.xitek.com/.+?/202005/\d{2}-\d{6}\.html',b)
i=5
for each in d:
      h="http:"+each
      m=requests.get(h,headers=header).content.decode('utf-8')
      print(m)
      n=re.findall(r'/uploads/allimg/\d{6}/\d{2,4}-.{8,12}\.jpg',m)
      print(n)
      i+=1
      z=1
      for x in n:
            q='http://info.xitek.com'+x
            print(q)
            y=requests.get(q,headers=header).content
            with open('e:\ '+str(i)+'-'+str(z)+'.jpg','wb')as f:
                  f.write(y)
                  z+=1
这是我练习爬图爬色影无忌网站的一段代码,能正常运行,也能下载图片,但就是下载的东西打不开,用迅雷检查了图片地址是没问题的迅雷下的能看。高手帮我看看是啥问题?
最佳答案
2020-5-25 22:15:03
把:
'Referer':'https://www.mzitu.com/japan/'

改成:
'Referer':'http://info.xitek.com/galleries/'

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-25 21:20:48 | 显示全部楼层
先收藏了 网址
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-25 21:22:58 | 显示全部楼层
这位兄台误会了吧,这是一个正经的摄影网站。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-25 21:42:52 | 显示全部楼层

一看就是小甲鱼教出来的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2020-5-25 22:04:33 | 显示全部楼层
本帖最后由 Twilight6 于 2020-5-25 22:07 编辑
tianyamingyue 发表于 2020-5-25 21:22
这位兄台误会了吧,这是一个正经的摄影网站。


兄台  我好无语 你为什么要弄一个 mizitu 的Referer...

是不是看了我的帖子....哈哈哈哈
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-25 22:15:03 | 显示全部楼层    本楼为最佳答案   
把:
'Referer':'https://www.mzitu.com/japan/'

改成:
'Referer':'http://info.xitek.com/galleries/'

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-26 00:22:37 | 显示全部楼层
小甲鱼的铁粉 发表于 2020-5-25 21:42
一看就是小甲鱼教出来的

哈哈  对
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-26 20:16:24 | 显示全部楼层

问题解决了,但我还想问一下,这个‘referer’到底起什么作用。我只认为是一个header做隐藏的。所以每次都复制粘贴。下别的网站也用这个头,没问题。为啥这个网站出问题了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-26 20:17:29 | 显示全部楼层
tianyamingyue 发表于 2020-5-26 20:16
问题解决了,但我还想问一下,这个‘referer’到底起什么作用。我只认为是一个header做隐藏的。所以每次 ...

有的网站不验证Referer呀,需要验证这个就要填
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-26 20:22:35 | 显示全部楼层
tianyamingyue 发表于 2020-5-26 20:16
问题解决了,但我还想问一下,这个‘referer’到底起什么作用。我只认为是一个header做隐藏的。所以每次 ...

Referer 主要用来表示从哪儿链接到当前的网页,如果你是爬虫没带上这个,对面服务器就找不到你是从哪里连接过来的就认为你是机器人,然后被反爬
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-11 16:55

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表