蹒跚学步小咸鱼 发表于 2020-11-25 16:06:58

python查询特定字符串在TXT日志文件出现的次数报UnicodeDecodeError错误

日志文件


查找日志文件中拍照成功出现的次数,
我的代码:

f = open(r'D:\shuju\20201124.txt')
counts = 0
for each_line in f:
    if '拍照成功' in each_line:
      counts += 1
f.close()
print(counts)

报错提示Traceback (most recent call last):
File "D:\shuju\cishutongji.py", line 3, in <module>
    for each_line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xba in position 49: illegal multibyte sequence

冬雪雪冬 发表于 2020-11-25 16:06:59

文本文件的编码问题,试试
f = open(r'D:\shuju\20201124.txt', encoding = 'utf-8')

蹒跚学步小咸鱼 发表于 2020-11-25 17:32:07

冬雪雪冬 发表于 2020-11-25 16:11
文本文件的编码问题,试试
f = open(r'D:\shuju\20201124.txt', encoding = 'utf-8')

确实    这个在哪里有帮助文档吗   防止后续出现类似情况

冬雪雪冬 发表于 2020-11-25 17:37:39

蹒跚学步小咸鱼 发表于 2020-11-25 17:32
确实    这个在哪里有帮助文档吗   防止后续出现类似情况

由于文本文件的编码多种多样,
1.自己写的文件最好统一存储成utf-8
2.别人提供的文件,可以参考这个,先判断编码:https://www.cnblogs.com/Wladybird/p/11249699.html
(小甲鱼也有一个帖子教如何判断编码的,一时找不到了)

蹒跚学步小咸鱼 发表于 2020-11-25 17:38:27

冬雪雪冬 发表于 2020-11-25 17:37
由于文本文件的编码多种多样,
1.自己写的文件最好统一存储成utf-8
2.别人提供的文件,可以参考这个, ...

谢谢
页: [1]
查看完整版本: python查询特定字符串在TXT日志文件出现的次数报UnicodeDecodeError错误