自己写了个简单的爬虫代码（爬取网站的图片），怎么都不成功（代码仿照小甲鱼XXOO的）

群里最菜的一个 · 发表于 2019-7-27 14:00:59

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

希望大佬帮我看看哪里出错了，感觉没出错呀。。。。

import urllib.request
import os

url='http://www.4399dmw.com/haizeiwang/tupian/'
req = urllib.request.Request(url)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2864.400')

os.mkdir('海贼王')                #创建文件夹
os.chdir('海贼王')

f=urllib.request.urlopen(url)             #获取网页内容并译码
html=f.read()
content=html.decode('utf-8')

img_list=[]                #创建列表，用于存放图片地址

a=content.find('src')          #寻找图片的地址，这一部分寻找是正确的
b=content.find('jpg',a,a+255)       #为了测试，只找一张图片
img_list.append(str(content[a+4:b+3]))

for each in img_list:       #将获取的图片存入文件夹
filename = each.split('/')[-1]
with open('D://a.jpg','wb') as F:
      G=urllib.request.urlopen(each)
      g=G.read()
      F.write(g)

zltzlt · 发表于 2019-7-27 14:04:51

你为什么发两个这样的帖

群里最菜的一个 · 发表于 2019-7-27 14:42:31

zltzlt 发表于 2019-7-27 14:04
你为什么发两个这样的帖

不好意思，刚才可能是网页卡住了。所以点了两下

群里最菜的一个 · 发表于 2019-7-27 14:43:15

这个网站我用小甲鱼的那段OOXX的代码是可以爬的

账号		自动登录	找回密码
密码			立即注册

自己写了个简单的爬虫代码（爬取网站的图片），怎么都不成功（代码仿照小甲鱼XXOO的）

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块