鱼C论坛

 找回密码
 立即注册
查看: 1200|回复: 10

[已解决]去除字符串中多余的字符怎么去

[复制链接]
发表于 2020-4-21 21:00:46 | 显示全部楼层 |阅读模式
5鱼币
要求:去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
比如是这样的:
1.245可乐   无异常
2.365开心   无
3.124你好    无
4.324小白    无异常
最佳答案
2020-4-21 21:00:47
本帖最后由 hrp 于 2020-4-22 07:51 编辑

中文符号可能排除不了
str1 = '''1.245可乐   无异常
2.365开心   无理
3.124你好    无
4.324小白    无异常'''

import re

res1 = re.findall(r'[\u4e00-\u9fa5]+', str1)
res2 = list()
for i in res1:
    # tmp = re.findall(r'[^\u65e0\u5f02\u5e38]+', i)    # 用这句,上面‘无理’的‘理’字会被匹配,看需求使用。
    tmp = re.findall(r'^[^\u65e0\u5f02\u5e38]+, i)        # 这行有个符号论坛显示不出来,看截图
    res2.extend(tmp)

print(res2)

# ['可乐', '开心', '你好', '小白']
批注 2020-04-22 002759.png

最佳答案

查看完整内容

中文符号可能排除不了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:00:47 | 显示全部楼层    本楼为最佳答案   
本帖最后由 hrp 于 2020-4-22 07:51 编辑

中文符号可能排除不了
str1 = '''1.245可乐   无异常
2.365开心   无理
3.124你好    无
4.324小白    无异常'''

import re

res1 = re.findall(r'[\u4e00-\u9fa5]+', str1)
res2 = list()
for i in res1:
    # tmp = re.findall(r'[^\u65e0\u5f02\u5e38]+', i)    # 用这句,上面‘无理’的‘理’字会被匹配,看需求使用。
    tmp = re.findall(r'^[^\u65e0\u5f02\u5e38]+, i)        # 这行有个符号论坛显示不出来,看截图
    res2.extend(tmp)

print(res2)

# ['可乐', '开心', '你好', '小白']
批注 2020-04-22 002759.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:02:25 | 显示全部楼层
先找到 要保留的,然后切片
还有,你要保留什么?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 21:19:48 | 显示全部楼层
liuzhengyuan 发表于 2020-4-21 21:02
先找到 要保留的,然后切片
还有,你要保留什么?

可乐,小白,开心,你好这些名字的还有很多类似的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:40:22 | 显示全部楼层
-Francis. 发表于 2020-4-21 21:19
可乐,小白,开心,你好这些名字的还有很多类似的

都是在例子中的位置的吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:47:31 | 显示全部楼层
>>> str1 = 'asdfas哼dfsc略略略zx.,v可乐,fut吆西吆西'  #字符串
>>> list1 = ['可乐','摩西摩西','吆西吆西','哼','略略略']            #要删除的元素
def find():
        global str1,list1
        for  i in list1:
                if i not in str1:
                        continue
                temp = str1.find(i)
                str1 = str1[:temp] + str1[temp+len(i):]
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 21:51:59 | 显示全部楼层

那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 22:14:07 | 显示全部楼层
-Francis. 发表于 2020-4-21 21:51
那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则

帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可
def mdel(s):
        list1=[] #这个是存入已经删选完毕的字符串,因为字符串不能中途插入,所以用列表
        for i in s: #迭代
                if not('0' <= i <= '9') and (i != '无' and i !='异' and i!='常' and i!=' '): #判断是不是要去掉的字符串
                        list1.append(i)
        return list1
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 22:24:25 | 显示全部楼层
liuzhengyuan 发表于 2020-4-21 22:14
帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可

我想要的是吧他们变成
[可乐,开心,你好,小白]
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 23:23:06 | 显示全部楼层
用replace()试试
str1 = "4.324小白    无异常"

list1 = ['2','3','4', '.', "无", "异常",'无异常', ' ']  # 这里要去除什么字符就添加什么

def str_filter(your_str,list_filter):
    for e in list_filter:
        your_str = your_str.replace(e, '')
    return your_str

print(str_filter(str1,list1))   # --> 输出 小白
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-22 09:08:20 | 显示全部楼层
-Francis. 发表于 2020-4-21 22:24
我想要的是吧他们变成
[可乐,开心,你好,小白]

那就试试切片,把这四个字符串中想要的字符用切片弄出来,然后再 append 到列表
(切片的位置可以用迭代来求)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-26 18:50

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表