今天的我更强了 发表于 2020-6-27 09:05:35

关于小甲鱼视频中讲的正则表达式获取贴吧图片

这是正则表达式:p=r'<img class="BDE_Image" src="([^"]+\.jpg)"'
这是地址:img class="BDE_Image" src="http://tiebapic.baidu.com/forum/w%3D580/sign=6fcdddb7307f9e2f70351d002f31e962/e3c7364e251f95ca1f8efde7de177f3e660952b1.jpg" size="102088" changedsize="true" width="560" height="560"

求指教:为什么要加[^"]?除了"都可以,但是地址中也没有"啊

Twilight6 发表于 2020-6-27 09:20:11

本帖最后由 Twilight6 于 2020-6-27 09:21 编辑



[^"]是匹配除 " 冒号以外的字符,而不是匹配 "

加这个可能是有些节点那有冒号,而我们不需要匹配到那个节点,所有通过这个过滤掉那个节点

今天的我更强了 发表于 2020-6-27 09:32:30

Twilight6 发表于 2020-6-27 09:20
[^"]是匹配除 " 冒号以外的字符,而不是匹配 "

加这个可能是有些节点那有冒号,而我们不需要匹配 ...

如果不加[^"]是不是会一直找到最后一个jpg"就是和贪婪模式有点像
如果加了 就会停在第一个jpg"   ,然后把中间的过滤掉 在找下一个

Twilight6 发表于 2020-6-27 09:44:07

今天的我更强了 发表于 2020-6-27 09:32
如果不加[^"]是不是会一直找到最后一个jpg"就是和贪婪模式有点像
如果加了 就会停在第一个jpg"   , ...

差不多吧,匹配多个还是一个具体看你是用什么来匹配吧,如果是用 findall 的话是把全部符合条件都匹配出来

乘号 发表于 2020-6-27 10:29:17

Twilight6 发表于 2020-6-27 09:44
差不多吧,匹配多个还是一个具体看你是用什么来匹配吧,如果是用 findall 的话是把全部符合条件都匹配出 ...

大佬升级啦{:10_277:}

Twilight6 发表于 2020-6-27 10:35:47

乘号 发表于 2020-6-27 10:29
大佬升级啦



{:10_250:} 前两天的事了

乘号 发表于 2020-6-27 10:53:22

Twilight6 发表于 2020-6-27 10:35
前两天的事了

啊这
页: [1]
查看完整版本: 关于小甲鱼视频中讲的正则表达式获取贴吧图片