正则--贪婪模式&非贪婪模式
https://dddddgz.github.io/tanlan.html贪婪模式和非贪婪模式
https://www.runoob.com/regexp/regexp-tutorial.html
贪婪模式的写法:.*
贪婪模式会匹配全部,即从第一个开始,到最后一个匹配到的结束。
使用 <p.*> 去匹配 <p><p>,会得到整个文本,即从第一个 <p> 一直匹配到最后一个 <p>。
非贪婪模式的写法:.*?
非贪婪模式指挥匹配一个,即找到一个后,往后找,只要找到一个就截止。
使用 <p.*?> 去匹配 <p><p>,将会提取到两个 <p> 标签。
相关代码
除了在线测试,还可以用以下代码来测试本页面所说的内容。
import re
res1 = re.match("<p.*>", "<p><p>")
res2 = re.match("<p.*?>", "<p><p>")
print(".*: ", res1)
print(".*?:", res2)
页:
[1]