|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
对不起各位了,上一个发的不利于读程序,重发- import urllib.request
- import re
- def head_headers(url):#模拟成浏览器
- req = urllib.request.Request(url)
- req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')
- page = urllib.request.urlopen(req)
- html = page.read()
- p = r'src="(http:[^"]+\.jpg)'#寻找条件
- imglist = re.findall(p, str(html))
- for each in imglist:
- print(each)#打印URL
- urllib.request.urlretrieve(each)
-
- url = 'http://www.sina.com.cn/'
- head_headers(url)
复制代码
谢谢大家
- import urllib.request
- import re
- import os
- def head_headers(url):#模拟成浏览器
- req = urllib.request.Request(url)
- req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')
- page = urllib.request.urlopen(req)
- html = page.read()
- p = r'src="(http:[^"]+\.jpg)'#寻找条件
- imglist = re.findall(p, str(html))
- # 设置图片保存目录
- folder = "images"
- if not os.path.exists(folder):
- os.mkdir(folder) #在当前目录下创建一个新目录
- os.chdir(folder) #把当前路径切换到新创建的目录
-
- for each in imglist:
- print(each)#打印URL
- # urlretrieve(url, filename=None, reporthook=None, data=None)
- # 参数 filename 指的是保存的 文件名 , 由于前面在当前程序目录下建立了images目录,并把
- # 工作路径切换到了 images 下,所以 下载的图片都保存到了images目录下
- urllib.request.urlretrieve(each, each.split('/')[-1])
- url = 'http://www.sina.com.cn/'
- head_headers(url)
复制代码
|
|