|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
- >>> url = '#<img class="BDE_Image" pic_type="0" src="https://imgsa.baidu.com/forum/w%3D580/sign=2ac3feab978fa0ec7fc764051696594a/3efd5266d0160924e30b9e83d20735fae6cd347f.jpg" width="560" height="560">'
- >>> p = r'<img class="BDE_Image".*?src="[^"]*\.jpg".*?>'
- >>> import re
- >>> re.search(p,url)
- <re.Match object; span=(1, 189), match='<img class="BDE_Image" pic_type="0" src="https://>
- >>> print(re.findall(p,url))
- ['<img class="BDE_Image" pic_type="0" src="https://imgsa.baidu.com/forum/w%3D580/sign=2ac3feab978fa0ec7fc764051696594a/3efd5266d0160924e30b9e83d20735fae6cd347f.jpg" width="560" height="560">']
- >>>
复制代码
大佬们,请教下,代码如上。
用re的search和findall方法,对同一个段文本进行处理,正则表达式都是p = r'<img class="BDE_Image".*?src="[^"]*\.jpg".*?>'
而url文本中都是只有一段是复合p的,为何search的match和findall的列表内容最后会不一致?
不是呀 他匹配到的是全部吧 span =(1,189) 匹配到位置参数的范围
|
|