关于小甲鱼视频中讲的正则表达式获取贴吧图片
这是正则表达式:p=r'<img class="BDE_Image" src="([^"]+\.jpg)"'这是地址:img class="BDE_Image" src="http://tiebapic.baidu.com/forum/w%3D580/sign=6fcdddb7307f9e2f70351d002f31e962/e3c7364e251f95ca1f8efde7de177f3e660952b1.jpg" size="102088" changedsize="true" width="560" height="560"
求指教:为什么要加[^"]?除了"都可以,但是地址中也没有"啊 本帖最后由 Twilight6 于 2020-6-27 09:21 编辑
[^"]是匹配除 " 冒号以外的字符,而不是匹配 "
加这个可能是有些节点那有冒号,而我们不需要匹配到那个节点,所有通过这个过滤掉那个节点
Twilight6 发表于 2020-6-27 09:20
[^"]是匹配除 " 冒号以外的字符,而不是匹配 "
加这个可能是有些节点那有冒号,而我们不需要匹配 ...
如果不加[^"]是不是会一直找到最后一个jpg"就是和贪婪模式有点像
如果加了 就会停在第一个jpg" ,然后把中间的过滤掉 在找下一个 今天的我更强了 发表于 2020-6-27 09:32
如果不加[^"]是不是会一直找到最后一个jpg"就是和贪婪模式有点像
如果加了 就会停在第一个jpg" , ...
差不多吧,匹配多个还是一个具体看你是用什么来匹配吧,如果是用 findall 的话是把全部符合条件都匹配出来 Twilight6 发表于 2020-6-27 09:44
差不多吧,匹配多个还是一个具体看你是用什么来匹配吧,如果是用 findall 的话是把全部符合条件都匹配出 ...
大佬升级啦{:10_277:} 乘号 发表于 2020-6-27 10:29
大佬升级啦
{:10_250:} 前两天的事了 Twilight6 发表于 2020-6-27 10:35
前两天的事了
啊这
页:
[1]