python删除txt文本中的数字、字母
ifn = r"E:/time/ab.txt"#读取txt文本ofn = r"E:/time/AB.txt"#写入txt文本
infile = open(ifn,'r')
outfile = open(ofn,'w')
for eachline in infile.readlines():
#去掉文本行里面d \t、数字
lines = filter(lambda ch: ch not in '\t1234567890', eachline)
outfile.write(lines)
infile.close
outfile.close
先读取txt文本,删除文本中所有的数字和字母,处理后的文本输入到txt中,上述代码是从网上抄来的,运行总是报错,有知道怎么解决的吗,谢谢 本帖最后由 jackz007 于 2022-11-4 10:25 编辑
这一行
for eachline in infile.readlines():
lines = filter(lambda ch: ch not in '\t1234567890', eachline)
. . . . . .
infile.close
outfile.close
改为
lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline)) #【修改】
. . . . . .
infile.close() #【修改】
outfile.close() #【修改】
报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改
如果报错中,报出的内容是编码错误,试着在 open 函数中添加上参数 encoding = "utf-8" 或者 encoding = "gbk"
而且这代码最后调用 close() 函数,你忘记加上括号了,导致实际上你并没有将文件关闭
Twilight6 发表于 2022-11-4 10:16
报错提示是什么?建议贴完代码最好附带也贴上报错提示,这样可以更快的找到问题进行代码的修改
如果报 ...
File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in <module>
for eachline in infile.readlines():
UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 2: illegal multibyte sequence
这是源代码报错提示
加上encoding = "utf-8" 或者 encoding = "gbk",出现新的报错
File "E:\Similarity\shanchu_shuzizimu_txt.py", line 19, in <module>
outfile.write(lines)
TypeError: write() argument must be str, not filter 本帖最后由 jackz007 于 2022-11-4 11:45 编辑
HE2021 发表于 2022-11-4 10:42
File "E:\Similarity\shanchu_shuzizimu_txt.py", line 15, in
for eachline in infile.readlines ...
ifn = r"E:/time/ab.txt"
ofn = r"E:/time/ABC.txt" # 在 Windows 系统,文件名不区分大小写字母,'ab.txt' 与 'AB.txt' 是同一个文件
infile = open(ifn , 'r' , encoding = 'UTF-8')
outfile = open(ofn , 'w') # 如果不改 ofn,执行完这一句 'ab.txt' 就会变成 0 字节,infile . readlines() 读不到任何东西。
for eachline in infile.readlines():
lines = '' . join(filter(lambda ch : ch not in '\t1234567890' , eachline))
outfile . write(lines)
infile . close()
outfile . close() jackz007 发表于 2022-11-4 11:22
非常感谢,明白啦
页:
[1]