鱼C论坛

 找回密码
 立即注册
查看: 1736|回复: 7

[已解决]正则表达式

[复制链接]
发表于 2021-2-21 21:32:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import re
str ='<div class="thumb">\
\
<a href="/article/121721100" target="blank">\
<img src="//pic.qiushibaike.com/system/pictures/12392/123925646/medium/ZXOKCHDF7DKY0J4D.jpg" alt="糗事#123925646">\
</a>\
\
</div>'
ex = r'<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
a = re.findall(ex,str,re.S)
print(a)

第一个问题:.*?      *的意思是匹配零次或者无数次,那么关闭贪婪模式后,岂不是永远只匹配0个字符?
第二个问题:上面这一段代码,难道不应该整个str都被匹配了吗?为什么只有//pic.qiushibaike.com/system/pictures/12392/123925646/medium/ZXOKCHDF7DKY0J4D.jpg被匹配了
最佳答案
2021-2-21 21:45:57
这个写法挺麻烦的其实

之所以没有匹配整个 str 是因为中间有一个括号

(.*?)

表示的是取括号里面的内容

也就是 src="后面的内容,一直到src右侧的"

简单一点的办法就是
import re
str = '<div class="thumb">\
\
<a href="/article/121721100" target="blank">\
<img src="//pic.qiushibaike.com/system/pictures/12392/123925646/medium/ZXOKCHDF7DKY0J4D.jpg" alt="糗事#123925646">\
</a>\
\
</div>'
ex = r'src="([^"]+[\.jpg|\.png])"'
a = re.findall(ex, str, re.S)
print(a)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-21 21:45:57 | 显示全部楼层    本楼为最佳答案   
这个写法挺麻烦的其实

之所以没有匹配整个 str 是因为中间有一个括号

(.*?)

表示的是取括号里面的内容

也就是 src="后面的内容,一直到src右侧的"

简单一点的办法就是
import re
str = '<div class="thumb">\
\
<a href="/article/121721100" target="blank">\
<img src="//pic.qiushibaike.com/system/pictures/12392/123925646/medium/ZXOKCHDF7DKY0J4D.jpg" alt="糗事#123925646">\
</a>\
\
</div>'
ex = r'src="([^"]+[\.jpg|\.png])"'
a = re.findall(ex, str, re.S)
print(a)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-21 21:49:01 | 显示全部楼层
我上面只修改了正则表达式部分

直接匹配并提取 src="后面的字符

[^"] 表示脱字符,小甲鱼在论坛的正则表达式的文章里有讲,就是匹配除了 "以外的字符

[\.jpg\.png] 就是匹配 .jpg 或 .png 文件
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-22 09:05:18 | 显示全部楼层

回帖奖励 +19 鱼币

这么狠么,一次19
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-22 12:45:28 | 显示全部楼层


吐血了,他应该是忘了设置人数了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-2-22 13:00:32 | 显示全部楼层
Daniel_Zhang 发表于 2021-2-21 21:45
这个写法挺麻烦的其实

之所以没有匹配整个 str 是因为中间有一个括号

太感谢啦!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-2-22 13:01:02 | 显示全部楼层

哈哈哈哈哈哈下次绝对不能让你摸鱼
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-22 14:47:35 | 显示全部楼层
19420107 发表于 2021-2-22 13:01
哈哈哈哈哈哈下次绝对不能让你摸鱼

嘿嘿
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-16 11:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表