好奇怪啊
>>> def get_encoding(file):with open(file, 'rb') as f:
return chardet.detect(f.read())['encoding']
>>> get_encoding('E:\\测试\\aaa.txt')
'TIS-620'
>>> get_encoding('E:\\测试\\girl_3.txt')
'windows-1251'
大佬们,我是正常建立的文件,为什么会有泰文编码(TIS-620),和俄文编码(windows-1251)的啊 把文本文件发上来,如果文件内容过少,系统会误判。 {:10_257:}{:10_257:}{:10_257:}这个好像是自动识别编码类型,然后给误判了,小甲鱼这里好像有一期讲过这个,那个什么模块来着
地址在这https://fishc.com.cn/thread-66086-1-1.html {:10_257:}{:10_257:}{:10_257:}建立文件一般都是加个指定编码类型的吧,encoding = "utf-8" 本帖最后由 杏仁好伐 于 2020-10-23 08:21 编辑
感谢各位大佬 本帖最后由 杏仁好伐 于 2020-10-23 08:23 编辑
{:10_254:}
页:
[1]