KONGYIYAO 发表于 2021-2-8 15:41:34

求问正则表达式相关问题

本帖最后由 KONGYIYAO 于 2021-2-8 16:04 编辑

1、result=re.search(r"(\w)(\w)","i love fishc.com")
匹配的结果match="love fishc",
i 还有.com 不会被匹配

2、然后这个原始字符串   r"<img class="BDE_Image".*?src="[^"]*\.jpg".*?>"。

.*?是表示什么
[^"]*\.是表示什么

suchocolate 发表于 2021-2-8 18:14:47

本帖最后由 suchocolate 于 2021-2-8 18:47 编辑

1. \w: 匹配数字字母下划线,(\w)(\w) 就是匹配连着的2个字母,所以匹配 lo。
2. 逐个解释:
1). : 匹配任意字符,除了换行符,当re.DOTALL(re.S)标记被指定时,则可以匹配包括换行符的任意字符。
2)* : 匹配0个或多个的表达式。.* 就是任意多的字符。
3)? : 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式。.*? 就是非贪婪的方式匹配任意字符。
4)[^abc] : 除了abc意外的所有字母。
5)\ :转义后面的特殊字符,\.就是转义.,让.恢复本来的字符意义,而非特殊字符。
6)[^"]*\. :这里是用来匹配图片url,匹配src到jpg之前的不能是双引号的字符,如果jpg后面有关于图片的其他html属性,只匹配尽量少的(非贪婪),防止匹配过多。

页: [1]
查看完整版本: 求问正则表达式相关问题