鱼C论坛

 找回密码
 立即注册
查看: 1426|回复: 7

[已解决]关于正则表达式的问题

[复制链接]
发表于 2020-3-17 00:12:07 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
>>> str1 = '<img src="https://bkimg.cdn.bcebos.com/pic/aa64034f78f0f7365cee8c570555b319ebc41350?x-bce-process=image/resize,m_lfit,w_268,limit_1/format,f_jpg">'
>>> re.search(r'img src=".*jpg',str1)
<re.Match object; span=(1, 144), match='img src="https://bkimg.cdn.bcebos.com/pic/aa64034>

匹配网页图片时的问题,.*的意思不是可以重复多次吗,这里为什么只能匹配到144,没有匹配完,这里的str1怎么提取网址信息啊????
最佳答案
2020-3-17 00:29:26
re.findall(r'<img src="(.*?)">', str1)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-17 00:29:26 | 显示全部楼层    本楼为最佳答案   
re.findall(r'<img src="(.*?)">', str1)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-17 00:30:44 From FishC Mobile | 显示全部楼层
本帖最后由 hrp 于 2020-3-17 07:59 编辑

1到144那不是一个完整的网址吗?re对象里没显示完整而已,你group()打印出来看一下。

要不你试试这个:
re.search(r'img src="(.*jpg)">',str1).group(1)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-17 07:26:22 From FishC Mobile | 显示全部楼层
1  144是索引
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-17 08:15:44 | 显示全部楼层
re.search()方法返回的是一个Match对象,
再调用group方法,才能获取匹配的字符串。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-17 09:33:13 | 显示全部楼层

确实实现了,但是*?不是开启非贪婪模式嘛,非贪婪的为啥也能匹配完整个啊?用findall我总觉得会返回一个多元素的列表,可能我有点绕进去了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-17 09:34:45 | 显示全部楼层
hrp 发表于 2020-3-17 00:30
1到144那不是一个完整的网址吗?re对象里没显示完整而已,你group()打印出来看一下。

要不你试试这个:
...

谢谢!!!search好像显示不完整,用findall就没这问题了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-17 09:43:26 From FishC Mobile | 显示全部楼层
yzy632154 发表于 2020-3-17 09:34
谢谢!!!search好像显示不完整,用findall就没这问题了

search返回的是re对象,你要调用对象的group方法才能看到完整的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-24 23:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表