鱼C论坛

 找回密码
 立即注册
查看: 2675|回复: 1

[作品展示] 表情包一弹

[复制链接]
发表于 2020-7-18 18:38:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. import parsel
  3. import time

  4. a = 999999999
  5. b = a +1
  6. for page in range(1,b):

  7.     try:
  8.         print("===================/正在爬取第{}页/===================".format(page))
  9.         base_url = 'https://www.doutula.com/photo/list/?page={}'.format(page)
  10.         headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}

  11.         response = requests.get(url = base_url, headers = headers)

  12.         html_data = response.text


  13.         selector = parsel.Selector(html_data)


  14.         result_list = selector.xpath('//a[@class="col-xs-6 col-sm-3"]')

  15.         if page>2:
  16.             time.sleep(3)
  17.             print('休眠中')

  18.     except:
  19.         pass

  20.     for result in result_list:
  21.         img_url = result.xpath('./img/@data-original').extract_first()
  22.         img_title = result.xpath('./img/@alt').extract_first()

  23.         all_title = img_title  + '.' + img_url.split('.')[-1]

  24.         img_data = requests.get(url = img_url,headers = headers).content

  25.         
  26.         #保存文件
  27.         try:
  28.             with open('image\\' + all_title, mode = 'wb') as f:
  29.                 print('保存完成:', all_title)
  30.                 f.write(img_data)

  31.         except:
  32.             pass
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-7-19 12:35:39 | 显示全部楼层
里面有个缩进问题 请各位鱼油注意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-30 14:02

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表