HE2021 发表于 2022-11-4 10:04:01

python删除txt文本中的数字、字母

ifn = r"E:/time/ab.txt"#读取txt文本
ofn = r"E:/time/AB.txt"#写入txt文本

infile = open(ifn,'r')
outfile = open(ofn,'w')

for eachline in infile.readlines():
#去掉文本行里面d \t、数字
lines = filter(lambda ch: ch not in '\t1234567890', eachline)

outfile.write(lines)

infile.close
outfile.close

先读取txt文本,删除文本中所有的数字和字母,处理后的文本输入到txt中,上述代码是从网上抄来的,运行总是报错,有知道怎么解决的吗,谢谢

jackz007 发表于 2022-11-4 10:16:20

本帖最后由 jackz007 于 2022-11-4 10:25 编辑

      这一行
for eachline in infile.readlines():
    lines = filter(lambda ch: ch not in '\t1234567890', eachline)
. . . . . .
infile.close
outfile.close
      改为
    lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline))    #【修改】
. . . . . .
infile.close()   #【修改】
outfile.close()    #【修改】

Twilight6 发表于 2022-11-4 10:16:33


报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改

如果报错中,报出的内容是编码错误,试着在 open 函数中添加上参数 encoding = "utf-8" 或者 encoding = "gbk"

而且这代码最后调用 close() 函数,你忘记加上括号了,导致实际上你并没有将文件关闭


HE2021 发表于 2022-11-4 10:42:00

Twilight6 发表于 2022-11-4 10:16
报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改

如果报 ...

File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in <module>
    for eachline in infile.readlines():
UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
这是源代码报错提示

加上encoding = "utf-8" 或者 encoding = "gbk",出现新的报错

File "E:\Similarity\shanchu_shuzizimu_txt.py", line 19, in <module>
    outfile.write(lines)
TypeError: write() argument must be str, not filter

jackz007 发表于 2022-11-4 11:22:41

本帖最后由 jackz007 于 2022-11-4 11:45 编辑

HE2021 发表于 2022-11-4 10:42
File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in
    for eachline in infile.readlines ...

ifn = r"E:/time/ab.txt"
ofn = r"E:/time/ABC.txt"   # 在 Windows 系统,文件名不区分大小写字母,'ab.txt' 与 'AB.txt' 是同一个文件

infile = open(ifn , 'r' , encoding = 'UTF-8')
outfile = open(ofn , 'w')    # 如果不改 ofn,执行完这一句 'ab.txt' 就会变成 0 字节,infile . readlines() 读不到任何东西。

for eachline in infile.readlines():
    lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline))
    outfile . write(lines)

infile . close()
outfile . close()

HE2021 发表于 2022-11-4 14:24:28

jackz007 发表于 2022-11-4 11:22


非常感谢,明白啦
页: [1]
查看完整版本: python删除txt文本中的数字、字母