鱼C论坛

 找回密码
 立即注册
查看: 1570|回复: 3

[技术交流] python爬虫 爬一个壁纸网站

[复制链接]
发表于 2022-1-10 21:13:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
一个python初学者写出来的小爬虫,各位大佬看看吧

import re
import os
import requests
if __name__ == '__main__':

    if not os.path.exists('./bizhi'):
        os.mkdir('./bizhi')

    print('4K专区36\n美女模特6\n爱情美图30\n风景大片9\n小清新15\n动漫卡通26\n明星风尚11\n萌宠动物11\n游戏壁纸5\n汽车天下12\n炫酷时尚10\n月历壁纸29\n影视剧照7\n节日美图13\n军事天地22\n劲爆体育16\nBABY秀18\n文字控35\n')
    c = input("请输入类型id:")
    a = input("从第几张开始:")
    b = input("下载几张:")
    url = 'http://lcoc.top/bizhi/api.php?cid='+c+'&start='+a+'&count='+b
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.73'
    }


    #获取url的响应
    response = requests.get(url=url,headers = headers).text
    #print(response)
    #正则表达式,筛选出图片的id
    ex = '"url_thumb".*?/t(.*?)","url_mid".*?'
    #成功获取图片id
    img_src_list = re.findall(ex,response,re.S)

    #print(img_src_list)
for src in img_src_list:
    # src = eval(repr(img).replace('\\\\', '/'))
    #拼出完整的url
    src = 'http://browser9.qhimg.com///bdr///__85///t' + src
    #print(src)
    #获取二进制图片
    img_data = requests.get(url=src,headers=headers).content

    img_name = src.split('/')[-1]
    #给图片创建路径并赋予名字
    imgPath = './bizhi/' + img_name
    #写入数据2
    with open(imgPath,'wb') as fp:
        fp.write(img_data)
        print(img_name,'下载成功')

评分

参与人数 1荣誉 +1 鱼币 +1 贡献 +1 收起 理由
不弃_ + 1 + 1 + 1 很棒!

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-1-21 14:46:38 From FishC Mobile | 显示全部楼层
小白的我看不懂,很难受,帮你顶顶
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-1-21 16:52:36 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-1 13:41:39 | 显示全部楼层
跑完没有图片
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-12 04:02

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表