鱼C论坛

 找回密码
 立即注册
查看: 1656|回复: 4

正则表达式的问题

[复制链接]
发表于 2023-10-6 07:54:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'



我在算考勤,,如何正确提取到“早退”的分钟数,,a的早退分钟要提取到373,b要提取到4分钟

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-6 07:54:53 | 显示全部楼层
可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:
import re

a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'

pattern = r'早退.*?(\d+)分钟'
match_a = re.search(pattern, a)
match_b = re.search(pattern, b)

if match_a:
    print(match_a.group(1))
if match_b:
    print(match_b.group(1))

输出结果为:
373
4

正则表达式 早退.*?(\d+)分钟 的意思是匹配以“早退”开头,后面跟着任意字符,最后以数字和“分钟”结尾的字符串,并提取其中的数字部分。使用 re.search 函数可以在字符串中搜索匹配正则表达式的部分,并返回一个 Match 对象。可以使用 group 方法来提取匹配到的内容。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-6 07:55:17 | 显示全部楼层
为了从给定的字符串中提取早退的分钟数,您可以使用 Python 的 re 库来编写一个简单的函数。这里是一个示例:
import re

def 提取早退分钟数(s):
    pattern = r'早退(?:超过最大档次)?(\\d+)分钟'
    match = re.search(pattern, s)
    if match:
        return int(match.group(1))
    else:
        return None

a = "迟到:迟到 19分钟,早退超过最大档次343分钟 373分钟,签到:08:48,签退:11:17"
b = '迟到:迟到 3分钟,早退:早退 4分钟,签到:07:32,签退:11:26'

print(提取早退分钟数(a))  # 输出:373
print(提取早退分钟数(b))  # 输出:4

这个函数使用正则表达式 早退(?:超过最大档次)?(\\d+)分钟 来匹配早退的分钟数。正则表达式中的 ?: 表示非捕获组,这意味着我们不关心这部分的具体内容,只关心紧跟在其后的数字部分。(\\d+) 用于捕获一个或多个数字字符,然后将其转换为整数。如果在字符串中找到匹配项,函数将返回对应的分钟数;否则,返回 None
请注意,本回答来自GPT-4
如果问题已经解决,请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-10-6 07:58:09 | 显示全部楼层
isdkz 发表于 2023-10-6 07:54
可以使用正则表达式来提取早退的分钟数。以下是一个示例代码:

我试了一下,是返回343
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-6 08:56:50 | 显示全部楼层
laiyuanjie 发表于 2023-10-6 07:58
我试了一下,是返回343

会返回343和373,因为这两个都匹配,取第二个就行了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-29 03:01

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表