复习一下妹子图（啊不对）爬虫

ietar · 发表于 2019-6-9 21:51:21

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

回复可直接复制代码

from bs4 import BeautifulSoup
import requests
import os
# 使用说明将py文件放在要保存图包的目录下运行
# number别太贪心目前主页24个我也就设置最大24
# 源url number确认要整几个图包
url0 = 'https://www.mzitu.com'
headers={
'referer': 'https://www.mzitu.com/188045',
'user-agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Mobile Safari/537.36'
}
number = int(input('how many:(max=24)'))
while number > 24:
number = int(input('how many:(max=24)'))
# 打开主页
res0 = requests.get(url0,headers=headers)
soup0 = BeautifulSoup(res0.text,'lxml')
# 正式开整
for h in range(number):
url = soup0.find('div', class_='main').find('div', class_='postlist')\
.find_all('li')[h].a['href']
res = requests.get(url,headers=headers)
soup = BeautifulSoup(res.text,'lxml')
target_url = soup.find('div',class_='main-image').img['src']
# filename = target_url.split(r'.net/')[-1]
# 懒得处理filename里的/了直接1 2 3 4命名图片完事
pages = soup.find('div',class_='pagenavi').find_all('a')[-2].span.text
title = soup.find('div',class_='content').find('h2',class_='main-title').text
print('正在搞第{}个'.format(h+1))
if title not in os.listdir():
os.mkdir(title)
os.chdir(title)
for i in range(int(pages)):
url1 = url + r'/' + str(i+1)
res1 = requests.get(url1,headers=headers)
soup = BeautifulSoup(res1.text,'lxml')
target_url = soup.find('div',class_='main-image').img['src']
res1 = requests.get(target_url,headers=headers)
with open(str(i+1)+r'.jpg', 'wb') as f:
f.write(res1.content)
os.chdir('..')
# 我完事了你们呢

复制代码

eric91 · 发表于 2019-6-9 21:58:29

好东西

chxchxkkk · 发表于 2019-6-10 09:48:09

支持一下

dysfm · 发表于 2019-6-10 13:40:00

膜拜大神

苏泱 · 发表于 2019-6-11 09:15:22

哈哈

想抓兔子的云 · 发表于 2019-6-11 09:24:31

感谢分享

非鱼~~ · 发表于 2019-6-11 10:01:04

优秀

小鲨鱼爱虾米 · 发表于 2019-6-11 11:34:18

艺术

九月水 · 发表于 2019-6-11 12:03:42

学习

895454048 · 发表于 2019-6-11 12:25:49

膜拜大神

imcampbell · 发表于 2019-6-11 12:26:17

本帖最后由 imcampbell 于 2019-6-11 12:29 编辑

运行出错了，是不是我的Python少了东西？

helloconan · 发表于 2019-6-11 13:36:58

学习一下

小贵妇 · 发表于 2019-6-11 14:13:41

爬虫想学

daleling · 发表于 2019-6-11 14:25:06

还有没其他的有图可以下的站点推荐的？

76978341 · 发表于 2019-6-11 14:50:19

sha

xixixixiansen · 发表于 2019-6-11 14:56:22

精华

fishc233 · 发表于 2019-6-11 15:02:50

学习学习

n197h · 发表于 2019-6-11 15:36:00

学习学习

qq2569650920 · 发表于 2019-6-11 18:45:28

666666666666666666666

ietar · 发表于 2019-6-11 19:29:26

imcampbell 发表于 2019-6-11 12:26
运行出错了，是不是我的Python少了东西？

贴个报错信息啊目测是没装requests bs4

账号		自动登录	找回密码
密码			立即注册

[作品展示] 复习一下妹子图（啊不对）爬虫

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块