鱼C论坛

 找回密码
 立即注册
查看: 2629|回复: 6

[已解决]q.read()

[复制链接]
发表于 2022-9-13 19:46:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
微信图片_20220913194408.jpg
最佳答案
2022-9-13 19:54:44
gaoxiuhua520 发表于 2022-9-13 19:47
没理解好,什么情况



编码错误,record.txt 编码可能是 utf-8 的,但是此时 open 打开编码是 gbk

utf-8 编码时,中文占3个以上字符,但 gbk 中文占 2个字符,所以会出现读取文件报错

在 open 函数中添加 encoding 参数设置下打开文件的编码,与你要打开的文件编码一致即可,即:
q = open('D:\\record.txt.txt' , encoding = 'utf-8')

还有一种办法就是将文件编码更改为 gbk,打开 txt 文件,选择另存为,出现弹窗后,查看右下角

如下图,选择 ANSI 为系统默认编码,中文 windows 系统默认就是 gbk


                               
登录/注册后可看大图

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-9-13 19:46:52 | 显示全部楼层
我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence(UnicodeDecodeError错误:“gbk”编解码器无法解码位置4处的字节0xae:非法的多字节序列)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-9-13 19:47:28 | 显示全部楼层
gaoxiuhua520 发表于 2022-9-13 19:46
我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte  ...

没理解好,什么情况
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:48:43 | 显示全部楼层
eencoding="utf-8"  在open里面加参数
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:52:31 | 显示全部楼层
txt文件编码有多种。
最好的办法是,先判断编码,然后在以指定编码打开。
import cchardet as chardet 

# 先检测出文件编码
with open("test.txt", "rb") as f:
    msg = f.read()

enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
print(enc)
enc = enc['encoding']

# 然后以指定编码打开文件
with open("test.txt", "r", encoding=enc) as f:
    print(f.read())
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:52:46 | 显示全部楼层
q = open('D:\\record.txt.txt' , encoding = 'UTF-8')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:54:44 | 显示全部楼层    本楼为最佳答案   
gaoxiuhua520 发表于 2022-9-13 19:47
没理解好,什么情况



编码错误,record.txt 编码可能是 utf-8 的,但是此时 open 打开编码是 gbk

utf-8 编码时,中文占3个以上字符,但 gbk 中文占 2个字符,所以会出现读取文件报错

在 open 函数中添加 encoding 参数设置下打开文件的编码,与你要打开的文件编码一致即可,即:
q = open('D:\\record.txt.txt' , encoding = 'utf-8')

还有一种办法就是将文件编码更改为 gbk,打开 txt 文件,选择另存为,出现弹窗后,查看右下角

如下图,选择 ANSI 为系统默认编码,中文 windows 系统默认就是 gbk


                               
登录/注册后可看大图

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-16 19:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表