[已解决]python爬虫只爬出来一张图片

一些些思念 · 发表于 2019-9-17 17:22:18

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

爬了两个贴，一个能够正常爬，另一个只能出一个图片
图片链接的正则表达式前面部分是一样的，应该没有问题，所以我找不到问题在哪
大佬们帮帮忙啊。
以下是代码：

import urllib.request
import re
import os

def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','')
'''
记得输入User_Agent
'''
page = urllib.request.urlopen(req)
html = page.read().decode('utf-8')

return html

def get_img(html,folder='11'):
os.mkdir(folder)
os.chdir(folder)
p = r'src="(https://imgsa.baidu.com[^"]+\.jpg)"'
imglist = re.findall(p,html)

'''
测试图片网站↓
'''
for each in imglist:
      print(each)

'''
（保存图片↓）
for each in imglist:
      filename = each.split("/")[-1]
      urllib.request.urlretrieve(each,filename,None)
'''

if __name__ == '__main__':
url = 'https://tieba.baidu.com/p/6092958671'
folder = input('保存文件夹名称:')
get_img(open_url(url),folder)

'''
（两个测试的网站）
https://tieba.baidu.com/p/6251125298?pn=3  --->  只能爬一张
https://tieba.baidu.com/p/6092958671    --->  一次能爬完

'''

最佳答案

月排行榜 / 总排行榜

facevoid

2019-9-17 18:21:42

你的代码没问题，问题出在你给的网页上，第一个网页只有一个符合条件的图片，所以就得到了一张图片，你可以打开那个网页看一下。

第二个网站里面有11张符合条件的，保存出来11个，没问题

跳转到最佳答案楼层

facevoid · 发表于 2019-9-17 18:21:42

这个最佳答案由 facevoid 给出，感谢 facevoid 的回答。

单击隐藏图章

你的代码没问题，问题出在你给的网页上，第一个网页只有一个符合条件的图片，所以就得到了一张图片，你可以打开那个网页看一下。

第二个网站里面有11张符合条件的，保存出来11个，没问题

一些些思念 · 发表于 2019-9-17 20:59:25

facevoid 发表于 2019-9-17 18:21
你的代码没问题，问题出在你给的网页上，第一个网页只有一个符合条件的图片，所以就得到了一张图片，你可以 ...

谢谢大佬，我知道了https://tieba.baidu.com/p/6251125298?pn=3中的pn=3是帖子的第几页，第三页是只有一个符合的，我在F12里面搜索jpg是整个贴吧的。感谢

账号		自动登录	找回密码
密码			立即注册