Python爬虫

混沌未开 · 发表于 2018-8-20 11:07:53

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由混沌未开于 2018-8-20 11:21 编辑

看着小甲鱼的视频学着爬妹子图
但是远程主机关闭。。。。
怎么解决这样的问题啊？
谢谢大佬

代码如下

import urllib.request
import os
def url_open(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.3.2.17331')
response = urllib.request.urlopen(url)
html = response.read()
return html
def get_page(): #获取页面网址
url = 'http://www.mmjpg.com/mm/240'
page_addrs = []
for i in range(1,20):
page_url = url + '/' + str(i)
page_addrs.append(page_url)
return page_addrs
def find_img(url):
html = url_open(url).decode('utf-8') #html获取没有问题
a = html.find('img src=')
b = html.find('.jpg',a)
print(html[a + 9:b + 4])
return html[a + 9:b + 4]
def save_img(folder,img_addrs):
file_name = img_addrs.split('/')[-1]
with open(file_name,'wb') as f:
img = url_open(img_addrs)
f.write(img)
def download_mm(folder = 'OOXX',pages = 10):
os.chdir(folder)
page_url = [] #初始化页面地址列表
page_url = get_page() #获取页面地址
for each in page_url:
img_addrs = find_img(each) #找到图片的地址
save_img(folder,img_addrs) #保存图片的地址到指定文件夹
if __name__ == '__main__':
download_mm()

复制代码

会出现这样的错误

无符号整形 · 发表于 2018-8-20 11:16:45

本帖最后由无符号整形于 2018-8-20 11:33 编辑

看5楼

混沌未开 · 发表于 2018-8-20 11:28:27

没爬煎蛋，爬的妹子图

混沌未开 · 发表于 2018-8-20 11:29:15

无符号整形发表于 2018-8-20 11:16
煎蛋反爬了，参考
https://fishc.com.cn/forum.php?mod=viewthread&tid=118887&highlight=%BC%E5%B5%B0

爬的妹子图

无符号整形 · 发表于 2018-8-20 11:32:45

混沌未开发表于 2018-8-20 11:29
爬的妹子图

好吧……我看错了……

混沌未开 · 发表于 2018-8-20 11:52:18

无符号整形发表于 2018-8-20 11:32
好吧……我看错了……

刚学爬虫，我尝试着啃了一下那个代码
我啃不动。。。。。。。

无符号整形 · 发表于 2018-8-20 11:52:54

混沌未开发表于 2018-8-20 11:52
刚学爬虫，我尝试着啃了一下那个代码
我啃不动。。。。。。。

算了，听说mmjpg很色的
我还是不帮你踩点了……

混沌未开 · 发表于 2018-8-20 11:57:01

无符号整形发表于 2018-8-20 11:52
算了，听说mmjpg很色的
我还是不帮你踩点了……

额
那换个网站？。。。。。
我只是想找个网站练练手

无符号整形 · 发表于 2018-8-20 14:19:03

混沌未开发表于 2018-8-20 11:57
额
那换个网站？。。。。。
我只是想找个网站练练手

嗯嗯……注意身体，别肾虚了。。。。。。。。

塔利班 · 发表于 2018-8-20 14:21:15

百度贴吧还是挺好爬的

账号		自动登录	找回密码
密码			立即注册