xinxin要努力 发表于 2022-1-10 21:13:15

python爬虫 爬一个壁纸网站

一个python初学者写出来的小爬虫,各位大佬看看吧

import re
import os
import requests
if __name__ == '__main__':

    if not os.path.exists('./bizhi'):
      os.mkdir('./bizhi')

    print('4K专区36\n美女模特6\n爱情美图30\n风景大片9\n小清新15\n动漫卡通26\n明星风尚11\n萌宠动物11\n游戏壁纸5\n汽车天下12\n炫酷时尚10\n月历壁纸29\n影视剧照7\n节日美图13\n军事天地22\n劲爆体育16\nBABY秀18\n文字控35\n')
    c = input("请输入类型id:")
    a = input("从第几张开始:")
    b = input("下载几张:")
    url = 'http://lcoc.top/bizhi/api.php?cid='+c+'&start='+a+'&count='+b
    headers = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.73'
    }


    #获取url的响应
    response = requests.get(url=url,headers = headers).text
    #print(response)
    #正则表达式,筛选出图片的id
    ex = '"url_thumb".*?/t(.*?)","url_mid".*?'
    #成功获取图片id
    img_src_list = re.findall(ex,response,re.S)

    #print(img_src_list)
for src in img_src_list:
    # src = eval(repr(img).replace('\\\\', '/'))
    #拼出完整的url
    src = 'http://browser9.qhimg.com///bdr///__85///t' + src
    #print(src)
    #获取二进制图片
    img_data = requests.get(url=src,headers=headers).content

    img_name = src.split('/')[-1]
    #给图片创建路径并赋予名字
    imgPath = './bizhi/' + img_name
    #写入数据2
    with open(imgPath,'wb') as fp:
      fp.write(img_data)
      print(img_name,'下载成功')

小生阅破万卷 发表于 2022-1-21 14:46:38

小白的我看不懂,很难受,帮你顶顶

hornwong 发表于 2022-1-21 16:52:36

{:5_95:}

yuanming1027 发表于 2022-3-1 13:41:39

跑完没有图片
页: [1]
查看完整版本: python爬虫 爬一个壁纸网站