鱼C论坛

 找回密码
 立即注册
查看: 1682|回复: 1

[已解决]正则

[复制链接]
发表于 2023-7-12 16:21:16 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
请问各位大佬,这个正则为什么不是直接把导员后面的提取出来,而是导演两个字页提取出来了
import re
strings = '导演: 加布里尔·穆奇诺 Gabriele Muccino 主演: '
title_pattern = re.compile('导演: (.*?) 主演:',re.S)
title = re.search(title_pattern,strings).group()
print(title)
这是打印出的结果
导演: 加布里尔·穆奇诺 Gabriele Muccino 主演:
最佳答案
2023-7-12 16:21:30
根据你提供的代码和正则表达式,问题出在 re.search(title_pattern, strings).group() 这一行。你使用的是 group() 函数来获取匹配结果,但它会返回整个匹配结果,包括正则表达式中的所有捕获组。

在这里,title_pattern 使用了一个非贪婪(非最大匹配)的通配符 .*? 来匹配导演的名字。然而,re.search().group() 会返回整个正则表达式匹配的结果,包括 ': ' 后面的内容。

为了只获取导演的名字,你可以使用 group(1) 来指定只返回第一个捕获组的内容。捕获组是由圆括号括起来的部分。在这个例子中,你只有一个捕获组,即导演的名字。

以下是修改后的代码:
import restrings = '导演: 加布里尔·穆奇诺 Gabriele Muccino 主演:'title_pattern = re.compile('导演: (.*?) 主演:', re.S)title = re.search(title_pattern, strings).group(1)print(title)
使用 group(1) 只返回第一个捕获组,也就是导演的名字。输出结果应该是 加布里尔·穆奇诺
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-7-12 16:21:30 | 显示全部楼层    本楼为最佳答案   
根据你提供的代码和正则表达式,问题出在 re.search(title_pattern, strings).group() 这一行。你使用的是 group() 函数来获取匹配结果,但它会返回整个匹配结果,包括正则表达式中的所有捕获组。

在这里,title_pattern 使用了一个非贪婪(非最大匹配)的通配符 .*? 来匹配导演的名字。然而,re.search().group() 会返回整个正则表达式匹配的结果,包括 ': ' 后面的内容。

为了只获取导演的名字,你可以使用 group(1) 来指定只返回第一个捕获组的内容。捕获组是由圆括号括起来的部分。在这个例子中,你只有一个捕获组,即导演的名字。

以下是修改后的代码:
import restrings = '导演: 加布里尔·穆奇诺 Gabriele Muccino 主演:'title_pattern = re.compile('导演: (.*?) 主演:', re.S)title = re.search(title_pattern, strings).group(1)print(title)
使用 group(1) 只返回第一个捕获组,也就是导演的名字。输出结果应该是 加布里尔·穆奇诺
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 13:30

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表