鱼C论坛

 找回密码
 立即注册
查看: 3171|回复: 5

[已解决]python删除txt文本中的数字、字母

[复制链接]
发表于 2022-11-4 10:04:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
ifn = r"E:/time/ab.txt"  #读取txt文本
ofn = r"E:/time/AB.txt"  #写入txt文本

infile = open(ifn,'r')
outfile = open(ofn,'w')

for eachline in infile.readlines():
  #去掉文本行里面d \t、数字
  lines = filter(lambda ch: ch not in '\t1234567890', eachline)

  outfile.write(lines)

infile.close
outfile.close

先读取txt文本,删除文本中所有的数字和字母,处理后的文本输入到txt中,上述代码是从网上抄来的,运行总是报错,有知道怎么解决的吗,谢谢
最佳答案
2022-11-4 10:16:20
本帖最后由 jackz007 于 2022-11-4 10:25 编辑

        这一行
for eachline in infile.readlines():
    lines = filter(lambda ch: ch not in '\t1234567890', eachline)
. . . . . .
infile.close
outfile.close
        改为
    lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline))    #【修改】
. . . . . .
infile.close()     #【修改】
outfile.close()    #【修改】
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-11-4 10:16:20 | 显示全部楼层    本楼为最佳答案   
本帖最后由 jackz007 于 2022-11-4 10:25 编辑

        这一行
for eachline in infile.readlines():
    lines = filter(lambda ch: ch not in '\t1234567890', eachline)
. . . . . .
infile.close
outfile.close
        改为
    lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline))    #【修改】
. . . . . .
infile.close()     #【修改】
outfile.close()    #【修改】
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-4 10:16:33 | 显示全部楼层

报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改

如果报错中,报出的内容是编码错误,试着在 open 函数中添加上参数 encoding = "utf-8" 或者 encoding = "gbk"

而且这代码最后调用 close() 函数,你忘记加上括号了,导致实际上你并没有将文件关闭


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-4 10:42:00 | 显示全部楼层
Twilight6 发表于 2022-11-4 10:16
报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改

如果报 ...

File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in <module>
    for eachline in infile.readlines():
UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
这是源代码报错提示

加上encoding = "utf-8" 或者 encoding = "gbk",出现新的报错

  File "E:\Similarity\shanchu_shuzizimu_txt.py", line 19, in <module>
    outfile.write(lines)
TypeError: write() argument must be str, not filter
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-4 11:22:41 | 显示全部楼层
本帖最后由 jackz007 于 2022-11-4 11:45 编辑
HE2021 发表于 2022-11-4 10:42
File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in
    for eachline in infile.readlines ...

ifn = r"E:/time/ab.txt"
ofn = r"E:/time/ABC.txt"     # 在 Windows 系统,文件名不区分大小写字母,'ab.txt' 与 'AB.txt' 是同一个文件

infile = open(ifn , 'r' , encoding = 'UTF-8')
outfile = open(ofn , 'w')    # 如果不改 ofn,执行完这一句 'ab.txt' 就会变成 0 字节,infile . readlines() 读不到任何东西。

for eachline in infile.readlines():
    lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline)) 
    outfile . write(lines) 

infile . close()
outfile . close()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2022-11-4 14:24:28 | 显示全部楼层

非常感谢,明白啦
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-10 03:17

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表