[已解决]正则截取双引号内的内容

lou · 发表于 2019-3-28 11:51:37

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

一句话只有一个引号的时候，小李说“今天的天气真好”

#coding=utf-8
import re
string1=‘小李说“今天的天气真好” ’

pattern = re.compile(‘”(.*)“’)
str_re1=pattern.findall(string1)
print (str_re1[0]) #提取双引号内的数据

结果得：今天的天气真好

但是，如果我要提取的内容是两句话，我就会碰到这种情况：
小李说“今天的天气真好” ，小明说”对，你说的没错“

#coding=utf-8
import re
string1=‘小李说“今天的天气真好” ，小明说”对，你说的没错“ ’
pattern = re.compile(‘”(.*)“’)
str_re1=pattern.findall(string1)
print (str_re1[0]) #提取双引号内的数据

结果为：今天的天气真好” ，小明说”对，你说的没错

就会造成了，只截取了最外围的双引号的值，这个问题要怎么解决呢？就是只输出：今天的天气真好对，你说的没错

最佳答案

月排行榜 / 总排行榜

凌九霄

2019-3-28 12:30:53

本帖最后由凌九霄于 2019-3-28 12:32 编辑

因为你提供的前后两句话的双引号并不是标准的 “” 对应，所以，如果不能改正的话，那么就只能死板的复制了引号去匹配，比如：
360截图20190328121610770.jpg

“([^”]+)”[^”]+”([^“]+) 取第一第二分组

跳转到最佳答案楼层

凌九霄 · 发表于 2019-3-28 12:16:44

标点要规范才行

lou · 发表于 2019-3-28 12:20:47

凌九霄发表于 2019-3-28 12:16
标点要规范才行

啥意思呀？这句话的文字内容是不可以改变的哦，因为这是一个测试case ，不是自己写的字符串，是要测试的对象

lou · 发表于 2019-3-28 12:28:07

凌九霄发表于 2019-3-28 12:16
标点要规范才行

我明白了，是要用“[^"]+" 替换（‘“(.*)"'）是吗？但是我也只能得到一句话的内容而已。。
如果我后面还有很多个引号的内容需要提取呢？麻烦您

凌九霄 · 发表于 2019-3-28 12:30:53

本帖最后由凌九霄于 2019-3-28 12:32 编辑

因为你提供的前后两句话的双引号并不是标准的 “” 对应，所以，如果不能改正的话，那么就只能死板的复制了引号去匹配，比如：
360截图20190328121610770.jpg

“([^”]+)”[^”]+”([^“]+) 取第一第二分组

lou · 发表于 2019-3-28 12:42:10

凌九霄发表于 2019-3-28 12:30
因为你提供的前后两句话的双引号并不是标准的 “” 对应，所以，如果不能改正的话，那么就只能死板的复制了 ...

import re
str_speaker_content_1 = 'Yesterday, I visited Sirs Andrew and Nancy I asked Sir Andrew who he was, and he answered impatiently: "Sir Nancy and I are Knaves" Then I met Sir Bill who introduced me to his wife and told me: "at least one of Sir Hilary and I is a Knave" Should I trust them'

pattern = re.compile('"([^"]+)"')
str_speaker_content_1 = str_speaker_content_1.replace(',','')
str_speaker_content_2 = pattern.findall(str_speaker_content_1) #findall在字符串中找到正则表达式所匹配的所有子串，并组成一个列表返回
print(str_speaker_content_2[0]) #提取双引号 “” 内的数据

那像这个，如果我加太多的话，这个列表的值就会说超出范围了 - -

lou · 发表于 2019-3-28 13:02:12

凌九霄发表于 2019-3-28 12:30
因为你提供的前后两句话的双引号并不是标准的 “” 对应，所以，如果不能改正的话，那么就只能死板的复制了 ...

解决了，谢谢你

账号		自动登录	找回密码
密码			立即注册

[已解决]正则截取双引号内的内容

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块