鱼C论坛

 找回密码
 立即注册
查看: 729|回复: 1

python读取.txt文件的中文编码问题

[复制链接]
发表于 2019-2-3 12:23:44 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
学习小甲鱼的课后题,查找文件夹内所有包含关键字的.txt文件,并且输出相应位置
问题代码:
def search_in_file(file_name,key):
    f = open(file_name)
    count = 0
    key_dict = dict()
    for each_line in f:
        count += 1
        if key in each_line:
            pos = pso_in_line(each_line,key)
            key_dict[count] = pos

    f.close()
    return key_dict


问题:
    for each_line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x99 in position 6840: illegal multibyte sequence

在百度上找的的修改:
    f = open(file_name,encoding='UTF-8')
错误又变成:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa6 in position 0: invalid start byte


这‘gbk’ 和 ‘uff-8’算是分不清了。
求大佬给个解决方案。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-2-3 12:52:55 | 显示全部楼层
用什么编辑器,不是记事本吧,它会自动在前面加上一段xxx的东西。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-28 15:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表