正则表达式分析字符串的问题

zjh100 · 发表于 2020-6-1 07:53:43

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

我企图使用爬虫在贴吧上爬取图片，简单的find方法已经实现全部功能
但我企图使用正则表达式（这样提高可移植性）
但是每次只会截取到一个页面最后一张图片的网址，这是为啥呢
a=re.findall(r'<img class="BDE_Image" [^$]+src="(http[^"]+\.jpg)"',response)
for url in a:
ry(folder,url)
这是我的代码，ry是在文件夹中新建文件f.write()的方法

xiaosi4081 · 发表于 2020-6-1 07:55:45

发完整代码

Twilight6 · 发表于 2020-6-1 08:04:46

建议发完整代码

suchocolate · 发表于 2020-6-1 08:19:10

a = re.findall(r'class="BDE_Image" src="(http.*?jpg)"', response)

复制代码

账号		自动登录	找回密码
密码			立即注册