杏仁好伐 发表于 2020-10-22 19:01:25

好奇怪啊

>>> def get_encoding(file):
        with open(file, 'rb') as f:
                return chardet.detect(f.read())['encoding']

       
>>> get_encoding('E:\\测试\\aaa.txt')
'TIS-620'
>>> get_encoding('E:\\测试\\girl_3.txt')
'windows-1251'

大佬们,我是正常建立的文件,为什么会有泰文编码(TIS-620),和俄文编码(windows-1251)的啊

冬雪雪冬 发表于 2020-10-22 20:19:19

把文本文件发上来,如果文件内容过少,系统会误判。

qq1484730945 发表于 2020-10-22 23:27:19

{:10_257:}{:10_257:}{:10_257:}这个好像是自动识别编码类型,然后给误判了,小甲鱼这里好像有一期讲过这个,那个什么模块来着
地址在这https://fishc.com.cn/thread-66086-1-1.html

qq1484730945 发表于 2020-10-22 23:28:19

{:10_257:}{:10_257:}{:10_257:}建立文件一般都是加个指定编码类型的吧,encoding = "utf-8"

杏仁好伐 发表于 2020-10-23 08:13:20

本帖最后由 杏仁好伐 于 2020-10-23 08:21 编辑

感谢各位大佬

杏仁好伐 发表于 2020-10-23 08:16:36

本帖最后由 杏仁好伐 于 2020-10-23 08:23 编辑

{:10_254:}
页: [1]
查看完整版本: 好奇怪啊