【作品展示】闲来无事做了个半自动获取妹子图的爬虫,Python交流,编程语言专区,鱼C论坛

Victory12 发表于 2019-11-28 19:29:32

yixiangke 发表于 2019-11-29 10:55:35

看帖回复帖

strongLC 发表于 2019-11-29 11:04:44

666666666

JAmo 发表于 2019-11-29 15:43:35

感謝無事忙的福利{:9_228:}

duanjingda 发表于 2019-11-29 18:35:36

1111

老菜鸟一只 发表于 2019-11-29 20:29:06

哥

洋二郎 发表于 2019-11-30 23:58:27

嘿嘿，你是小甲鱼肚子里的蛔虫吗

洋二郎 发表于 2019-12-1 00:03:28

Traceback (most recent call last):
File "爬图.py", line 2, in <module>
import requests
ModuleNotFoundError: No module named 'requests'

***Repl Closed***
朋友，我这个怎么回事？

617255626 发表于 2019-12-2 01:57:56

马克

hxm0113 发表于 2019-12-2 16:38:45

想知道爬下来的图片存到哪里了

lowr 发表于 2019-12-3 10:24:24

谢谢分享！

伪。发表于 2019-12-3 16:37:02

{:5_90:}{:5_90:}

xldsw1314 发表于 2019-12-3 17:01:18

kankan xuexixuexi

伪。发表于 2019-12-3 17:04:24

# 爬取妹子图
import requests
from bs4 import BeautifulSoup

# 得到每个页面的链接
def get_url():
for i in range(1, 51):
   url = 'http://www.mzitu.com/116519/' + str(i)# 基本上这个图片网站都可以以这种形式下载，所有是半自动，图片的网址你需要自己输入，就看你喜欢哪种类型
   yield url

# 得到妹子图片的链接
def get_girl_url(url_list):
for url in url_list:
   headers = {
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
         'Referer': 'http://wwww.mzitu.com'}
   res = requests.get(url, headers=headers)
   html = res.text
   print(html)
   soup = BeautifulSoup(html, 'html.parser')
   img_url = soup.find(class_='main').find('img').get('src')
   yield img_url

# 存储妹子图片到本地
def save_img(img_url_list):
for img_url in img_url_list:
   Picreferer = {
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
         'Referer': 'http://i.meizitu.net'}# 加Referer属性是防止盗链图的产生，目的是告诉服务器当前请求是从哪个页面请求过来的
   res = requests.get(img_url, headers=Picreferer)
   html = res.content
   filename = 'D:\MM\\' + img_url.split('/')[-1]# 这里保存文件路径请依据自己的电脑位置来存放
   with open(filename, 'wb') as f:
         f.write(html)

list1 = get_url()
list2 = get_girl_url(list1)
save_img(list2)

clytze927 发表于 2019-12-4 10:28:48

{:5_106:}

l1366151464 发表于 2019-12-4 16:53:14

学习

452046297 发表于 2019-12-4 18:40:15

kankan

xxwoaini897 发表于 2019-12-4 23:01:38

学习

862434627 发表于 2019-12-4 23:13:19

厉害

ali1943 发表于 2019-12-5 10:29:19

ddd

页: 98 99 100 101 102 103 104 105 106 107 [108] 109 110 111 112 113 114 115 116 117

鱼C论坛's Archiver