18508410033 发表于 2020-9-22 20:05:33

正则表达式求解

<span class="title">肖申克的救赎</span>

findTitle = re.compile(r'<span class="title">(.*?)</span>')

titles = re.findall(findTitle,item)


item就是包含了(<span class="title">肖申克的救赎</span>)这个的一大段字符串

为什么re.findall(findTitle,item)这个语句应该是在item符合findTitle里面的规则,那应该提取出来的就是 ’<span class="title">肖申克的救赎</span>'这一段字符串才对,为什么最终提取出来的是 ‘肖申克的救赎’这个字符串呢

疾风怪盗 发表于 2020-9-22 20:14:11

你不加()不就 提取出['<span class="title">肖申克的救赎</span>']这样的么

import re
item='<span class="title">肖申克的救赎</span>'

findTitle = re.compile(r'<span class="title">.*?</span>')

titles = re.findall(findTitle,item)
print(titles)

suchocolate 发表于 2020-9-22 20:18:02

书看完整。
()是一组,默认只显示组,想显示组外的,得设置非捕获标识(?:)
findTitle = re.compile(r'<span class="title">(?:.*?)</span>')

18508410033 发表于 2020-9-22 20:55:25

suchocolate 发表于 2020-9-22 20:18
书看完整。
()是一组,默认只显示组,想显示组外的,得设置非捕获标识(?:)
findTitle = re.compile(r'(?: ...

懂了,多谢老哥
页: [1]
查看完整版本: 正则表达式求解