鱼C论坛

 找回密码
 立即注册
查看: 1588|回复: 10

[已解决]去除字符串中多余的字符怎么去

[复制链接]
发表于 2020-4-21 21:00:46 | 显示全部楼层 |阅读模式
5鱼币
要求:去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
比如是这样的:
1.245可乐   无异常
2.365开心   无
3.124你好    无
4.324小白    无异常
最佳答案
2020-4-21 21:00:47
本帖最后由 hrp 于 2020-4-22 07:51 编辑

中文符号可能排除不了
  1. str1 = '''1.245可乐   无异常
  2. 2.365开心   无理
  3. 3.124你好    无
  4. 4.324小白    无异常'''

  5. import re

  6. res1 = re.findall(r'[\u4e00-\u9fa5]+', str1)
  7. res2 = list()
  8. for i in res1:
  9.     # tmp = re.findall(r'[^\u65e0\u5f02\u5e38]+', i)    # 用这句,上面‘无理’的‘理’字会被匹配,看需求使用。
  10.     tmp = re.findall(r'^[^\u65e0\u5f02\u5e38]+, i)        # 这行有个符号论坛显示不出来,看截图
  11.     res2.extend(tmp)

  12. print(res2)

  13. # ['可乐', '开心', '你好', '小白']
复制代码

批注 2020-04-22 002759.png

最佳答案

查看完整内容

中文符号可能排除不了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:00:47 | 显示全部楼层    本楼为最佳答案   
本帖最后由 hrp 于 2020-4-22 07:51 编辑

中文符号可能排除不了
  1. str1 = '''1.245可乐   无异常
  2. 2.365开心   无理
  3. 3.124你好    无
  4. 4.324小白    无异常'''

  5. import re

  6. res1 = re.findall(r'[\u4e00-\u9fa5]+', str1)
  7. res2 = list()
  8. for i in res1:
  9.     # tmp = re.findall(r'[^\u65e0\u5f02\u5e38]+', i)    # 用这句,上面‘无理’的‘理’字会被匹配,看需求使用。
  10.     tmp = re.findall(r'^[^\u65e0\u5f02\u5e38]+, i)        # 这行有个符号论坛显示不出来,看截图
  11.     res2.extend(tmp)

  12. print(res2)

  13. # ['可乐', '开心', '你好', '小白']
复制代码

批注 2020-04-22 002759.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:02:25 | 显示全部楼层
先找到 要保留的,然后切片
还有,你要保留什么?
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 21:19:48 | 显示全部楼层
liuzhengyuan 发表于 2020-4-21 21:02
先找到 要保留的,然后切片
还有,你要保留什么?

可乐,小白,开心,你好这些名字的还有很多类似的
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:40:22 | 显示全部楼层
-Francis. 发表于 2020-4-21 21:19
可乐,小白,开心,你好这些名字的还有很多类似的

都是在例子中的位置的吗
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 21:47:31 | 显示全部楼层
  1. >>> str1 = 'asdfas哼dfsc略略略zx.,v可乐,fut吆西吆西'  #字符串
  2. >>> list1 = ['可乐','摩西摩西','吆西吆西','哼','略略略']            #要删除的元素
复制代码

  1. def find():
  2.         global str1,list1
  3.         for  i in list1:
  4.                 if i not in str1:
  5.                         continue
  6.                 temp = str1.find(i)
  7.                 str1 = str1[:temp] + str1[temp+len(i):]
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 21:51:59 | 显示全部楼层

那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 22:14:07 | 显示全部楼层
-Francis. 发表于 2020-4-21 21:51
那是要保存的
要求是去除字符串中多余的字符,有空格,数字,小数点,还有无异常和无这个字
可以用正则

帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可
  1. def mdel(s):
  2.         list1=[] #这个是存入已经删选完毕的字符串,因为字符串不能中途插入,所以用列表
  3.         for i in s: #迭代
  4.                 if not('0' <= i <= '9') and (i != '无' and i !='异' and i!='常' and i!=' '): #判断是不是要去掉的字符串
  5.                         list1.append(i)
  6.         return list1
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-21 22:24:25 | 显示全部楼层
liuzhengyuan 发表于 2020-4-21 22:14
帮你写了一个 有注释但是返回是列表,你把列表转成字符串即可

我想要的是吧他们变成
[可乐,开心,你好,小白]
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-21 23:23:06 | 显示全部楼层
用replace()试试

  1. str1 = "4.324小白    无异常"

  2. list1 = ['2','3','4', '.', "无", "异常",'无异常', ' ']  # 这里要去除什么字符就添加什么

  3. def str_filter(your_str,list_filter):
  4.     for e in list_filter:
  5.         your_str = your_str.replace(e, '')
  6.     return your_str

  7. print(str_filter(str1,list1))   # --> 输出 小白
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-22 09:08:20 | 显示全部楼层
-Francis. 发表于 2020-4-21 22:24
我想要的是吧他们变成
[可乐,开心,你好,小白]

那就试试切片,把这四个字符串中想要的字符用切片弄出来,然后再 append 到列表
(切片的位置可以用迭代来求)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-16 06:46

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表