python爬虫爬一个壁纸网站,Python交流,编程语言专区,鱼C论坛

xinxin要努力 发表于 2022-1-10 21:13:15

python爬虫爬一个壁纸网站

一个python初学者写出来的小爬虫，各位大佬看看吧

import re
import os
import requests
if __name__ == '__main__':

if not os.path.exists('./bizhi'):
   os.mkdir('./bizhi')

print('4K专区36\n美女模特6\n爱情美图30\n风景大片9\n小清新15\n动漫卡通26\n明星风尚11\n萌宠动物11\n游戏壁纸5\n汽车天下12\n炫酷时尚10\n月历壁纸29\n影视剧照7\n节日美图13\n军事天地22\n劲爆体育16\nBABY秀18\n文字控35\n')
c = input("请输入类型id：")
a = input("从第几张开始：")
b = input("下载几张：")
url = 'http://lcoc.top/bizhi/api.php?cid='+c+'&start='+a+'&count='+b
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.73'
}

#获取url的响应
response = requests.get(url=url,headers = headers).text
#print(response)
#正则表达式，筛选出图片的id
ex = '"url_thumb".*?/t(.*?)","url_mid".*?'
#成功获取图片id
img_src_list = re.findall(ex,response,re.S)

#print(img_src_list)
for src in img_src_list:
# src = eval(repr(img).replace('\\\\', '/'))
#拼出完整的url
src = 'http://browser9.qhimg.com///bdr///__85///t' + src
#print(src)
#获取二进制图片
img_data = requests.get(url=src,headers=headers).content

img_name = src.split('/')[-1]
#给图片创建路径并赋予名字
imgPath = './bizhi/' + img_name
#写入数据2
with open(imgPath,'wb') as fp:
   fp.write(img_data)
   print(img_name,'下载成功')

小生阅破万卷 发表于 2022-1-21 14:46:38

小白的我看不懂，很难受，帮你顶顶

hornwong 发表于 2022-1-21 16:52:36

{:5_95:}

yuanming1027 发表于 2022-3-1 13:41:39

跑完没有图片

页: [1]

鱼C论坛's Archiver

python爬虫 爬一个壁纸网站

python爬虫爬一个壁纸网站