鱼C论坛

 找回密码
 立即注册
查看: 1457|回复: 1

编码解码问题:python文件 打包后就不能处理日语文档的问题怎么解决?

[复制链接]
发表于 2018-2-11 22:39:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
编写了一个很简单的py文件,用来处理word文档并输出,用pyinstaller打包后运行正常,但是在处理日语文档时出错了,提示如下图,请问大佬们如何解决?谢谢!
3.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-2-11 22:44:59 | 显示全部楼层
参考:
使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式


(1)网页编码判断:
import urllib
rawdata = urllib.urlopen('http://www.google.cn/').read()
import chardet
chardet.detect(rawdata)

>>>{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}



(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print(enc['encoding'])
tt.close()


# 以指定编码打开文件
with open("新建文本文档.txt", "r", encoding=enc) as f:
    print(f.read())
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-30 04:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表