鱼C论坛

 找回密码
 立即注册
查看: 1898|回复: 1

[分享] 表情包一弹

[复制链接]
发表于 2020-7-18 18:38:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
import parsel
import time

a = 999999999
b = a +1
for page in range(1,b):

    try:
        print("===================/正在爬取第{}页/===================".format(page))
        base_url = 'https://www.doutula.com/photo/list/?page={}'.format(page)
        headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}

        response = requests.get(url = base_url, headers = headers)

        html_data = response.text


        selector = parsel.Selector(html_data)


        result_list = selector.xpath('//a[@class="col-xs-6 col-sm-3"]')

        if page>2:
            time.sleep(3)
            print('休眠中')

    except:
        pass

    for result in result_list:
        img_url = result.xpath('./img/@data-original').extract_first()
        img_title = result.xpath('./img/@alt').extract_first()

        all_title = img_title  + '.' + img_url.split('.')[-1]

        img_data = requests.get(url = img_url,headers = headers).content

        
        #保存文件
        try:
            with open('image\\' + all_title, mode = 'wb') as f:
                print('保存完成:', all_title)
                f.write(img_data)

        except:
            pass
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-7-19 12:35:39 | 显示全部楼层
里面有个缩进问题 请各位鱼油注意
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-22 12:18

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表