[已解决]我可以打印出这个图片的地址，但是下载不了图片是什么梗？？？想哭

xunyu · 发表于 2018-1-6 21:24:07

您需要登录才可以下载或查看，没有账号？立即注册

x

对不起各位了，上一个发的不利于读程序，重发

import urllib.request
import re
def head_headers(url):#模拟成浏览器
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')
page = urllib.request.urlopen(req)
html = page.read()
p = r'src="(http:[^"]+\.jpg)'#寻找条件
imglist = re.findall(p, str(html))
for each in imglist:
print(each)#打印URL
urllib.request.urlretrieve(each)
url = 'http://www.sina.com.cn/'
head_headers(url)

复制代码

谢谢大家

最佳答案

ba21

2018-1-6 21:53:46

import urllib.request
import re
import os
def head_headers(url):#模拟成浏览器
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')
page = urllib.request.urlopen(req)
html = page.read()
p = r'src="(http:[^"]+\.jpg)'#寻找条件
imglist = re.findall(p, str(html))
# 设置图片保存目录
folder = "images"
if not os.path.exists(folder):
os.mkdir(folder) #在当前目录下创建一个新目录
os.chdir(folder) #把当前路径切换到新创建的目录
for each in imglist:
print(each)#打印URL
# urlretrieve(url, filename=None, reporthook=None, data=None)
# 参数 filename 指的是保存的文件名 , 由于前面在当前程序目录下建立了images目录，并把
# 工作路径切换到了 images 下，所以下载的图片都保存到了images目录下
urllib.request.urlretrieve(each, each.split('/')[-1])
url = 'http://www.sina.com.cn/'
head_headers(url)

复制代码

小甲鱼 · 发表于 2018-1-6 21:42:41

这里面木有图片的 URL 呀？

ba21 · 发表于 2018-1-6 21:53:46

import urllib.request
import re
import os
def head_headers(url):#模拟成浏览器
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')
page = urllib.request.urlopen(req)
html = page.read()
p = r'src="(http:[^"]+\.jpg)'#寻找条件
imglist = re.findall(p, str(html))
# 设置图片保存目录
folder = "images"
if not os.path.exists(folder):
os.mkdir(folder) #在当前目录下创建一个新目录
os.chdir(folder) #把当前路径切换到新创建的目录
for each in imglist:
print(each)#打印URL
# urlretrieve(url, filename=None, reporthook=None, data=None)
# 参数 filename 指的是保存的文件名 , 由于前面在当前程序目录下建立了images目录，并把
# 工作路径切换到了 images 下，所以下载的图片都保存到了images目录下
urllib.request.urlretrieve(each, each.split('/')[-1])
url = 'http://www.sina.com.cn/'
head_headers(url)

复制代码

xunyu · 发表于 2018-1-6 21:57:47

ba21 发表于 2018-1-6 21:53

谢谢大佬

账号		自动登录	找回密码
密码			立即注册