gaoxiuhua520 发表于 2022-9-13 19:46:01

q.read()

gaoxiuhua520 发表于 2022-9-13 19:46:52

我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence(UnicodeDecodeError错误:“gbk”编解码器无法解码位置4处的字节0xae:非法的多字节序列)

gaoxiuhua520 发表于 2022-9-13 19:47:28

gaoxiuhua520 发表于 2022-9-13 19:46
我百度过了,UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte...

没理解好,什么情况

ZhKQYu 发表于 2022-9-13 19:48:43

eencoding="utf-8"在open里面加参数

ba21 发表于 2022-9-13 19:52:31

txt文件编码有多种。
最好的办法是,先判断编码,然后在以指定编码打开。
import cchardet as chardet

# 先检测出文件编码
with open("test.txt", "rb") as f:
    msg = f.read()

enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
print(enc)
enc = enc['encoding']

# 然后以指定编码打开文件
with open("test.txt", "r", encoding=enc) as f:
    print(f.read())

jackz007 发表于 2022-9-13 19:52:46

q = open('D:\\record.txt.txt' , encoding = 'UTF-8')

Twilight6 发表于 2022-9-13 19:54:44

gaoxiuhua520 发表于 2022-9-13 19:47
没理解好,什么情况


编码错误,record.txt 编码可能是 utf-8 的,但是此时 open 打开编码是 gbk

utf-8 编码时,中文占3个以上字符,但 gbk 中文占 2个字符,所以会出现读取文件报错

在 open 函数中添加 encoding 参数设置下打开文件的编码,与你要打开的文件编码一致即可,即:

q = open('D:\\record.txt.txt' , encoding = 'utf-8')

还有一种办法就是将文件编码更改为 gbk,打开 txt 文件,选择另存为,出现弹窗后,查看右下角

如下图,选择 ANSI 为系统默认编码,中文 windows 系统默认就是 gbk

https://xxx.ilovefishc.com/forum/202006/22/222937li4vv400i6v44b6z.png
页: [1]
查看完整版本: q.read()