鱼C论坛

 找回密码
 立即注册
查看: 1632|回复: 11

[已解决]正则表达式,找出两边是空格或尽头的字符串,怎么写

[复制链接]
发表于 2020-3-14 11:59:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 hrp 于 2020-3-14 12:04 编辑

想找出所有符合两边是空格或者尽头的字符串。
比如原字符串:
string1 = 'abc     de.f g hijk6'
string2 = 'lmn'
# 原字符串中可能出现任意字符(空白字符只会出现空格),不会出现换行。

现在我想找出:
# string1:['abc', 'de.f', 'g', 'hijk6']
# string2:['lmn']
应该怎么写正则表达式?(一个表达式,两个原字符串都能找出结果)

不用split。
最佳答案
2020-3-14 12:36:03
本帖最后由 一个账号 于 2020-3-14 12:40 编辑

用 for 循环写:
def calc(func):
    def wrapper(*args, **kwargs):
        import time
        
        start = time.perf_counter()
        
        ret = func(*args, **kwargs)

        during = f"{(time.perf_counter() - start) * 1000 : .3f}"

        print(f"运行时长 : {during} 毫秒")

        return ret
    
    return wrapper

@calc
def func(str1):
    list1 = []
    temp = ""

    for i in str1[:]+" ":
        if not i.isspace():
            temp += i
            
        elif temp:
            list1.append(temp)
            temp = ""

    return list1

if __name__ == "__main__":
    str1 = "abc     de.f g hijk6"
    str2 = "lmn"

    print(func(str1))
    print(func(str2))
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-14 12:36:03 | 显示全部楼层    本楼为最佳答案   
本帖最后由 一个账号 于 2020-3-14 12:40 编辑

用 for 循环写:
def calc(func):
    def wrapper(*args, **kwargs):
        import time
        
        start = time.perf_counter()
        
        ret = func(*args, **kwargs)

        during = f"{(time.perf_counter() - start) * 1000 : .3f}"

        print(f"运行时长 : {during} 毫秒")

        return ret
    
    return wrapper

@calc
def func(str1):
    list1 = []
    temp = ""

    for i in str1[:]+" ":
        if not i.isspace():
            temp += i
            
        elif temp:
            list1.append(temp)
            temp = ""

    return list1

if __name__ == "__main__":
    str1 = "abc     de.f g hijk6"
    str2 = "lmn"

    print(func(str1))
    print(func(str2))
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 12:45:42 | 显示全部楼层

要用正则表达式
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 12:46:43 | 显示全部楼层
瞎写了一个,不过完全不对
from re import findall
pat = r"(?: ([^ ]+?) )|(?:^(.*?))|(?:(.*?)$)"
string1 = 'abc     de.f g hijk6'
string2 = 'lmn'
print(findall(pat, string1))
print(findall(pat, string2))

评分

参与人数 1荣誉 +1 鱼币 +1 收起 理由
hrp + 1 + 1

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 12:55:42 | 显示全部楼层
zltzlt 发表于 2020-3-14 12:46
瞎写了一个,不过完全不对

这个用正则表达式好像写不出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-14 13:56:04 | 显示全部楼层
本帖最后由 hrp 于 2020-3-14 14:19 编辑
zltzlt 发表于 2020-3-14 12:46
瞎写了一个,不过完全不对


我去百度了各种先行后发零宽断言,写了一个,勉强符合要求,但是还有问题
不知道为何:
from re import findall

# pat = r"(?<=^|\b)\S+?(?=\s|$)"  # 不支持变长(|左右字符长度不相等)后发零宽断言,只能用\b替代\s以保证长度相等,但符号开头的字符串比如以下的%ascn匹配不到%。
pat = r"(?<![0-9a-zA-Z~`!@#$%^&*()_+-/=.\|*])\S+?(?=\s|$)"  # 暴力解决 :)

string1 = 'abc     de.f g hijk6'
string2 = 'lmn'
string3 = 'aca% 21474836 476.-61 %ascn'

print(findall(pat, string1))
print(findall(pat, string2))
print(findall(pat, string3))

# ['abc', 'de.f', 'g', 'hijk6']
# ['lmn']
# ['aca%', '21474836', '476.-61', '%ascn']
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 15:18:23 | 显示全部楼层
>>> import re
>>> a = 'aca% 21474836 476.-61 %ascn'
>>> re.findall(r'(?<=\s).*?(?=\s|$)|(?<=^).*?(?=\s|$)', re.sub(r' +', ' ', a))
['aca%', '21474836', '476.-61', '%ascn']

好坑啊,後發斷言不支持變長

评分

参与人数 1荣誉 +2 鱼币 +2 收起 理由
hrp + 2 + 2

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-14 15:31:50 From FishC Mobile | 显示全部楼层
wcshds 发表于 2020-3-14 15:18
好坑啊,後發斷言不支持變長

好办法
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 16:05:11 | 显示全部楼层
这样试试“

from re import findall
pat = r"\s?([\w\.\"\%\$\+\-\*\/\(\)]+)\s?"
string1 = 'abc     de.f g hijk6'
string2 = 'lmn'
a = 'aca% 21474836 476.-61 %ascn'
print(findall(pat, string1))
print(findall(pat, string2))
print(findall(pat, a))
#['abc', 'de.f', 'g', 'hijk6']
#['lmn']
#['aca%', '21474836', '476.-61', '%ascn']

评分

参与人数 1荣誉 +2 鱼币 +2 收起 理由
hrp + 2 + 2 感谢楼主无私奉献!

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 16:07:01 | 显示全部楼层
pat = r"([\w\.\"\%\$\+\-\*\/\(\)]+)(?=\s|$)"
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-14 16:44:28 From FishC Mobile | 显示全部楼层
kaohsing 发表于 2020-3-14 16:05
这样试试“

from re import findall

大神
方括号里的反斜杠是用来转义的吗,不是说方括号里的字符都没有特殊意义吗(我昨天刚学正则不怎么明白)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-14 16:58:41 | 显示全部楼层
我是为了保险都转义了,你可以去掉试试。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-24 20:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表