-Francis. 发表于 2020-4-21 21:00:46

去除字符串中多余的字符怎么去

要求:去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
比如是这样的:
1.245可乐   无异常
2.365开心   无
3.124你好    无
4.324小白    无异常

hrp 发表于 2020-4-21 21:00:47

本帖最后由 hrp 于 2020-4-22 07:51 编辑

中文符号可能排除不了{:10_245:}
str1 = '''1.245可乐   无异常
2.365开心   无理
3.124你好    无
4.324小白    无异常'''

import re

res1 = re.findall(r'[\u4e00-\u9fa5]+', str1)
res2 = list()
for i in res1:
    # tmp = re.findall(r'[^\u65e0\u5f02\u5e38]+', i)    # 用这句,上面‘无理’的‘理’字会被匹配,看需求使用。
    tmp = re.findall(r'^[^\u65e0\u5f02\u5e38]+, i)        # 这行有个符号论坛显示不出来,看截图
    res2.extend(tmp)

print(res2)

# ['可乐', '开心', '你好', '小白']

liuzhengyuan 发表于 2020-4-21 21:02:25

先找到 要保留的,然后切片
还有,你要保留什么?

-Francis. 发表于 2020-4-21 21:19:48

liuzhengyuan 发表于 2020-4-21 21:02
先找到 要保留的,然后切片
还有,你要保留什么?

可乐,小白,开心,你好这些名字的还有很多类似的

wuqramy 发表于 2020-4-21 21:40:22

-Francis. 发表于 2020-4-21 21:19
可乐,小白,开心,你好这些名字的还有很多类似的

都是在例子中的位置的吗

_荟桐_ 发表于 2020-4-21 21:47:31

>>> str1 = 'asdfas哼dfsc略略略zx.,v可乐,fut吆西吆西'#字符串
>>> list1 = ['可乐','摩西摩西','吆西吆西','哼','略略略']            #要删除的元素

def find():
        global str1,list1
        fori in list1:
                if i not in str1:
                        continue
                temp = str1.find(i)
                str1 = str1[:temp] + str1

-Francis. 发表于 2020-4-21 21:51:59

_荟桐_ 发表于 2020-4-21 21:47


那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则

liuzhengyuan 发表于 2020-4-21 22:14:07

-Francis. 发表于 2020-4-21 21:51
那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则

帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可
def mdel(s):
        list1=[] #这个是存入已经删选完毕的字符串,因为字符串不能中途插入,所以用列表
        for i in s: #迭代
                if not('0' <= i <= '9') and (i != '无' and i !='异' and i!='常' and i!=' '): #判断是不是要去掉的字符串
                        list1.append(i)
        return list1

-Francis. 发表于 2020-4-21 22:24:25

liuzhengyuan 发表于 2020-4-21 22:14
帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可

我想要的是吧他们变成
[可乐,开心,你好,小白]

karinlee 发表于 2020-4-21 23:23:06

用replace()试试

str1 = "4.324小白    无异常"

list1 = ['2','3','4', '.', "无", "异常",'无异常', ' ']# 这里要去除什么字符就添加什么

def str_filter(your_str,list_filter):
    for e in list_filter:
      your_str = your_str.replace(e, '')
    return your_str

print(str_filter(str1,list1))   # --> 输出 小白

liuzhengyuan 发表于 2020-4-22 09:08:20

-Francis. 发表于 2020-4-21 22:24
我想要的是吧他们变成
[可乐,开心,你好,小白]

那就试试切片,把这四个字符串中想要的字符用切片弄出来,然后再 append 到列表
(切片的位置可以用迭代来求)
页: [1]
查看完整版本: 去除字符串中多余的字符怎么去