鱼C论坛

 找回密码
 立即注册
12
返回列表 发新帖
楼主: zhoujie13

[已解决]如何用爬虫爬漫画

[复制链接]
发表于 2023-5-3 19:20:09 | 显示全部楼层
这个代码更合适,json字符串不用自己处理的

import re
import requests
import json

url = 'https://www.guoguomh.com/manhua/yiquanchaoren/2066301.html'
r = requests.get(url)
print('var chapterImages = [' in r.text)
pattern = re.compile(r'var chapterImages = (\[.*\])')
imglist = json.loads(pattern.search(r.text)[1])
for i in imglist:
    # 可以换成下载图片并对图片编号的代码
    print(i)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-5-3 19:25:30 | 显示全部楼层
isdkz 发表于 2023-5-3 18:14
你不能强买强卖,要给出客户满意的答案


sfqxx、陶远航会跟我抢排名,得把好友撤了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-5-3 19:28:51 | 显示全部楼层
歌者文明清理员 发表于 2023-5-3 19:25
sfqxx、陶远航会跟我抢排名,得把好友撤了

撤掉好友有什么用吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-5-3 19:29:30 | 显示全部楼层
isdkz 发表于 2023-5-3 19:28
撤掉好友有什么用吗?

az
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-23 09:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表