laiyuanjie 发表于 2023-10-6 07:54:42

正则表达式的问题

a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'



我在算考勤,,如何正确提取到“早退”的分钟数,,a的早退分钟要提取到373,b要提取到4分钟

isdkz 发表于 2023-10-6 07:54:53

可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:

import re

a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'

pattern = r'早退.*?(\d+)分钟'
match_a = re.search(pattern, a)
match_b = re.search(pattern, b)

if match_a:
    print(match_a.group(1))
if match_b:
    print(match_b.group(1))


输出结果为:

373
4


正则表达式 早退.*?(\d+)分钟 的意思是匹配以“早退”开头,后面跟着任意字符,最后以数字和“分钟”结尾的字符串,并提取其中的数字部分。使用 re.search 函数可以在字符串中搜索匹配正则表达式的部分,并返回一个 Match 对象。可以使用 group 方法来提取匹配到的内容。

陶远航 发表于 2023-10-6 07:55:17

为了从给定的字符串中提取早退的分钟数,您可以使用 Python 的 re 库来编写一个简单的函数。这里是一个示例:

import re

def 提取早退分钟数(s):
    pattern = r'早退(?:超过最大档次)?(\\d+)分钟'
    match = re.search(pattern, s)
    if match:
      return int(match.group(1))
    else:
      return None

a = \"迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17\"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'

print(提取早退分钟数(a))# 输出:373
print(提取早退分钟数(b))# 输出:4


这个函数使用正则表达式 早退(?:超过最大档次)?(\\d+)分钟 来匹配早退的分钟数。正则表达式中的 ?: 表示非捕获组,这意味着我们不关心这部分的具体内容,只关心紧跟在其后的数字部分。(\\d+) 用于捕获一个或多个数字字符,然后将其转换为整数。如果在字符串中找到匹配项,函数将返回对应的分钟数;否则,返回 None。
请注意,本回答来自GPT-4
如果问题已经解决,请设置最佳答案

laiyuanjie 发表于 2023-10-6 07:58:09

isdkz 发表于 2023-10-6 07:54
可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:




我试了一下,是返回343

kerln888 发表于 2023-10-6 08:56:50

laiyuanjie 发表于 2023-10-6 07:58
我试了一下,是返回343

会返回343和373,因为这两个都匹配,取第二个就行了
页: [1]
查看完整版本: 正则表达式的问题