jtxs0000 发表于 2020-7-29 13:22:46

第一次用爬虫爬取图片

第一次使用,花了很长时间,还问了论坛一些大佬的问题
最终效果我还是挺满意的,大家说我这算是入门了吗{:10_266:}
import re
import random
import requests

mins = int(input("请输入起始数:"))
maxs = int(input("请输入最大数(数字不能大于30000):"))
nums = int(input("你要下载多少张图片:"))
num = 1
for i in random.sample(range(mins,maxs),nums):
    headers = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3760.400 QQBrowser/10.5.4083.400'
    }
    #彼岸图网的图片批量下载
    urls = "http://pic.netbian.com"
    url = "http://pic.netbian.com/tupian/{}.html".format(str(i))
    res = requests.get(url,headers=headers)
    res.encoding="gbk"
    html = res.text
    #正则表达式搜索图片地址
    image = re.findall('<img src="(.*?)" data-pic',html)
    #匹配图片名字      
    name = re.findall('<h1>(.*?)</h1>',html)   
    #字符串与列表拼接            
    images =    
    #print("正在下载的链接为:",url)      
    #取出每一张图片的名字            
    for names in name:                  
      print("============正在下载第%d张图片:============="%num)
      print(names)
      #循环遍历图片
      for img in images:
            #图片名字                           
            file_name = str(names) + ".jpg"      
            #再次GET网址               
            response = requests.get(img,headers=headers)   
            #将图片保存到本地
            with open("./images/" + file_name,"wb") as f:
                f.write(response.content)
                #print("正在下载第%d张图片,请稍等....."%num)
                #print("下载成功,保存成功!")
            num +=1
print("下载完成....")
      
   







xiaosi4081 发表于 2020-7-29 13:37:28

sofa

jtxs0000 发表于 2020-7-29 14:15:16

{:9_224:}

不2b的铅笔 发表于 2021-7-15 17:18:47

学习一下{:10_245:}
页: [1]
查看完整版本: 第一次用爬虫爬取图片