|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
一个python初学者写出来的小爬虫,各位大佬看看吧
import re
import os
import requests
if __name__ == '__main__':
if not os.path.exists('./bizhi'):
os.mkdir('./bizhi')
print('4K专区36\n美女模特6\n爱情美图30\n风景大片9\n小清新15\n动漫卡通26\n明星风尚11\n萌宠动物11\n游戏壁纸5\n汽车天下12\n炫酷时尚10\n月历壁纸29\n影视剧照7\n节日美图13\n军事天地22\n劲爆体育16\nBABY秀18\n文字控35\n')
c = input("请输入类型id:")
a = input("从第几张开始:")
b = input("下载几张:")
url = 'http://lcoc.top/bizhi/api.php?cid='+c+'&start='+a+'&count='+b
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.73'
}
#获取url的响应
response = requests.get(url=url,headers = headers).text
#print(response)
#正则表达式,筛选出图片的id
ex = '"url_thumb".*?/t(.*?)","url_mid".*?'
#成功获取图片id
img_src_list = re.findall(ex,response,re.S)
#print(img_src_list)
for src in img_src_list:
# src = eval(repr(img).replace('\\\\', '/'))
#拼出完整的url
src = 'http://browser9.qhimg.com///bdr///__85///t' + src
#print(src)
#获取二进制图片
img_data = requests.get(url=src,headers=headers).content
img_name = src.split('/')[-1]
#给图片创建路径并赋予名字
imgPath = './bizhi/' + img_name
#写入数据2
with open(imgPath,'wb') as fp:
fp.write(img_data)
print(img_name,'下载成功')
|
评分
-
查看全部评分
|