鱼C论坛

 找回密码
 立即注册
查看: 3069|回复: 6

[已解决]q.read()

[复制链接]
发表于 2022-9-13 19:46:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
微信图片_20220913194408.jpg
最佳答案
2022-9-13 19:54:44
gaoxiuhua520 发表于 2022-9-13 19:47
没理解好,什么情况



编码错误,record.txt 编码可能是 utf-8 的,但是此时 open 打开编码是 gbk

utf-8 编码时,中文占3个以上字符,但 gbk 中文占 2个字符,所以会出现读取文件报错

在 open 函数中添加 encoding 参数设置下打开文件的编码,与你要打开的文件编码一致即可,即:

  1. q = open('D:\\record.txt.txt' , encoding = 'utf-8')
复制代码


还有一种办法就是将文件编码更改为 gbk,打开 txt 文件,选择另存为,出现弹窗后,查看右下角

如下图,选择 ANSI 为系统默认编码,中文 windows 系统默认就是 gbk


                               
登录/注册后可看大图

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-9-13 19:46:52 | 显示全部楼层
我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence(UnicodeDecodeError错误:“gbk”编解码器无法解码位置4处的字节0xae:非法的多字节序列)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-9-13 19:47:28 | 显示全部楼层
gaoxiuhua520 发表于 2022-9-13 19:46
我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte  ...

没理解好,什么情况
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:48:43 | 显示全部楼层
eencoding="utf-8"  在open里面加参数
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:52:31 | 显示全部楼层
txt文件编码有多种。
最好的办法是,先判断编码,然后在以指定编码打开。
  1. import cchardet as chardet

  2. # 先检测出文件编码
  3. with open("test.txt", "rb") as f:
  4.     msg = f.read()

  5. enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
  6. print(enc)
  7. enc = enc['encoding']

  8. # 然后以指定编码打开文件
  9. with open("test.txt", "r", encoding=enc) as f:
  10.     print(f.read())
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:52:46 | 显示全部楼层
  1. q = open('D:\\record.txt.txt' , encoding = 'UTF-8')
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-13 19:54:44 | 显示全部楼层    本楼为最佳答案   
gaoxiuhua520 发表于 2022-9-13 19:47
没理解好,什么情况



编码错误,record.txt 编码可能是 utf-8 的,但是此时 open 打开编码是 gbk

utf-8 编码时,中文占3个以上字符,但 gbk 中文占 2个字符,所以会出现读取文件报错

在 open 函数中添加 encoding 参数设置下打开文件的编码,与你要打开的文件编码一致即可,即:

  1. q = open('D:\\record.txt.txt' , encoding = 'utf-8')
复制代码


还有一种办法就是将文件编码更改为 gbk,打开 txt 文件,选择另存为,出现弹窗后,查看右下角

如下图,选择 ANSI 为系统默认编码,中文 windows 系统默认就是 gbk


                               
登录/注册后可看大图

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-27 00:30

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表