第一次用爬虫爬取图片,Python交流,编程语言专区,鱼C论坛

jtxs0000 发表于 2020-7-29 13:22:46

第一次用爬虫爬取图片

第一次使用，花了很长时间，还问了论坛一些大佬的问题
最终效果我还是挺满意的，大家说我这算是入门了吗{:10_266:}
import re
import random
import requests

mins = int(input("请输入起始数："))
maxs = int(input("请输入最大数(数字不能大于30000)："))
nums = int(input("你要下载多少张图片："))
num = 1
for i in random.sample(range(mins,maxs),nums):
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3760.400 QQBrowser/10.5.4083.400'
}
#彼岸图网的图片批量下载
urls = "http://pic.netbian.com"
url = "http://pic.netbian.com/tupian/{}.html".format(str(i))
res = requests.get(url,headers=headers)
res.encoding="gbk"
html = res.text
#正则表达式搜索图片地址
image = re.findall('<img src="(.*?)" data-pic',html)
#匹配图片名字
name = re.findall('<h1>(.*?)</h1>',html)
#字符串与列表拼接
images =
#print("正在下载的链接为：",url)
#取出每一张图片的名字
for names in name:
   print("============正在下载第%d张图片：============="%num)
   print(names)
   #循环遍历图片
   for img in images:
         #图片名字
         file_name = str(names) + ".jpg"
         #再次GET网址
         response = requests.get(img,headers=headers)
         #将图片保存到本地
         with open("./images/" + file_name,"wb") as f:
            f.write(response.content)
            #print("正在下载第%d张图片，请稍等....."%num)
            #print("下载成功，保存成功！")
         num +=1
print("下载完成....")

xiaosi4081 发表于 2020-7-29 13:37:28

sofa

jtxs0000 发表于 2020-7-29 14:15:16

{:9_224:}

不2b的铅笔 发表于 2021-7-15 17:18:47

学习一下{:10_245:}

页: [1]

鱼C论坛's Archiver

第一次用爬虫爬取图片