鱼C论坛

 找回密码
 立即注册
查看: 1680|回复: 1

问题解决

[复制链接]
发表于 2022-5-8 16:18:40 | 显示全部楼层
文本文件是有编码的。
不是每个文本文件使用的编码都一样。

在读一个文件前先确定用的什么编码,然后指定编码open
  1. import cchardet as chardet

  2. # 先检测出文件编码
  3. with open("test.txt", "rb") as f:
  4.     msg = f.read()

  5. enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
  6. print(enc)
  7. enc = enc['encoding']

  8. # 然后以指定编码打开文件
  9. with open("test.txt", "r", encoding=enc) as f:
  10.     print(f.read())
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-29 09:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表