鱼C论坛

 找回密码
 立即注册
楼主: Python小新人

[技术交流] 【作品展示】闲来无事做了个半自动获取妹子图的爬虫

  [复制链接]
发表于 2019-11-28 19:29:32 | 显示全部楼层
6
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-11-29 10:55:35 | 显示全部楼层
看帖回复帖
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-29 11:04:44 | 显示全部楼层
666666666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-29 15:43:35 | 显示全部楼层
感謝無事忙的福利
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-11-29 18:35:36 | 显示全部楼层
1111
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-11-29 20:29:06 | 显示全部楼层


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-11-30 23:58:27 | 显示全部楼层
嘿嘿,你是小甲鱼肚子里的蛔虫吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-1 00:03:28 | 显示全部楼层
Traceback (most recent call last):
  File "爬图.py", line 2, in <module>
    import requests
ModuleNotFoundError: No module named 'requests'

***Repl Closed***
朋友,我这个怎么回事?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-2 01:57:56 | 显示全部楼层
马克
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-2 16:38:45 | 显示全部楼层
想知道爬下来的图片存到哪里了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-3 10:24:24 | 显示全部楼层
谢谢分享!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-3 16:37:02 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-3 17:01:18 | 显示全部楼层
kankan xuexixuexi
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-3 17:04:24 | 显示全部楼层
# 爬取妹子图
import requests
from bs4 import BeautifulSoup


# 得到每个页面的链接
def get_url():
    for i in range(1, 51):
        url = 'http://www.mzitu.com/116519/' + str(i)  # 基本上这个图片网站都可以以这种形式下载,所有是半自动,图片的网址你需要自己输入,就看你喜欢哪种类型
        yield url


# 得到妹子图片的链接
def get_girl_url(url_list):
    for url in url_list:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
            'Referer': 'http://wwww.mzitu.com'}
        res = requests.get(url, headers=headers)
        html = res.text
        print(html)
        soup = BeautifulSoup(html, 'html.parser')
        img_url = soup.find(class_='main').find('img').get('src')
        yield img_url


# 存储妹子图片到本地
def save_img(img_url_list):
    for img_url in img_url_list:
        Picreferer = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
            'Referer': 'http://i.meizitu.net'}  # 加Referer属性是防止盗链图的产生,目的是告诉服务器当前请求是从哪个页面请求过来的
        res = requests.get(img_url, headers=Picreferer)
        html = res.content
        filename = 'D:\MM\\' + img_url.split('/')[-1]  # 这里保存文件路径请依据自己的电脑位置来存放
        with open(filename, 'wb') as f:
            f.write(html)


list1 = get_url()
list2 = get_girl_url(list1)
save_img(list2)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-4 10:28:48 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-4 16:53:14 | 显示全部楼层
学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-4 18:40:15 | 显示全部楼层
kankan
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-4 23:01:38 | 显示全部楼层
学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-4 23:13:19 | 显示全部楼层
厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-5 10:29:19 | 显示全部楼层
ddd
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-24 15:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表