鱼C论坛

 找回密码
 立即注册
查看: 753|回复: 1

怎样才能爬取下一页图片?

[复制链接]
发表于 2019-6-8 16:53:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
    num = 1
    for imageUrl in imagesList:
        path = os.path.join(toPath, str(num) + ".jpg")

        num += 1
    # 把图片下载到本地存储
        urllib.request.urlretrieve("http://" + imageUrl, filename=path)


#一直刷图,但只能一次下18张,num又执行一遍又等于1,怎样才能等于19继续下图?
page = 391
while page!=380:

    url = "https://www.mzitu.com/zipai/comment-page-" + str(page) + "/#comments"
    page -= 1

    imageCrawler(url, toPath)


////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

这里的num,只能到达18,怎样才能到19?

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-10 16:30:51 | 显示全部楼层
这是一个很奇怪的问题,不过有一次我遇见了类似现象,当时for i in urls:
当时urls是一个变量,是一个文件夹名字,本来应该是os.listdir()的,但是我给# 掉了,简单来说,当时urls不是列表,而是一个文件名。
刚好当时文件名是8个字母的,导致我的for只执行8次。
因为当时这个问题很奇怪又很小,很容易呼略,我后来才发现for的不全。
再检查了两次才发现是文件夹的名字刚好是8个字母。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-16 07:33

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表