正则表达式的问题
a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'
我在算考勤,,如何正确提取到“早退”的分钟数,,a的早退分钟要提取到373,b要提取到4分钟 可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:
import re
a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'
pattern = r'早退.*?(\d+)分钟'
match_a = re.search(pattern, a)
match_b = re.search(pattern, b)
if match_a:
print(match_a.group(1))
if match_b:
print(match_b.group(1))
输出结果为:
373
4
正则表达式 早退.*?(\d+)分钟 的意思是匹配以“早退”开头,后面跟着任意字符,最后以数字和“分钟”结尾的字符串,并提取其中的数字部分。使用 re.search 函数可以在字符串中搜索匹配正则表达式的部分,并返回一个 Match 对象。可以使用 group 方法来提取匹配到的内容。 为了从给定的字符串中提取早退的分钟数,您可以使用 Python 的 re 库来编写一个简单的函数。这里是一个示例:
import re
def 提取早退分钟数(s):
pattern = r'早退(?:超过最大档次)?(\\d+)分钟'
match = re.search(pattern, s)
if match:
return int(match.group(1))
else:
return None
a = \"迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17\"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'
print(提取早退分钟数(a))# 输出:373
print(提取早退分钟数(b))# 输出:4
这个函数使用正则表达式 早退(?:超过最大档次)?(\\d+)分钟 来匹配早退的分钟数。正则表达式中的 ?: 表示非捕获组,这意味着我们不关心这部分的具体内容,只关心紧跟在其后的数字部分。(\\d+) 用于捕获一个或多个数字字符,然后将其转换为整数。如果在字符串中找到匹配项,函数将返回对应的分钟数;否则,返回 None。
请注意,本回答来自GPT-4
如果问题已经解决,请设置最佳答案 isdkz 发表于 2023-10-6 07:54
可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:
我试了一下,是返回343 laiyuanjie 发表于 2023-10-6 07:58
我试了一下,是返回343
会返回343和373,因为这两个都匹配,取第二个就行了
页:
[1]