关于python编码的问题
在学习<python cookbook>第一章1.3保留最后N个元素,在测试代码的时候,发现编码问题报错如下:UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence
我用的是notepad写的代码,运行平台是win7,python3.4,开始读的的txt是含有中文的,后来报错,我就把内容全改成英文的,可是还是报错,现在我想对python关于编码的原理比解决这个问题的兴趣更大,在网上搜了一下关于python编码的,就文章来说,我是理解了大部分,但还是没弄明白python在运行代码时候编码的处理机制,比如,with open('D:/Python/Progarms/Test/test.txt', 'r') as f:
在这句代码中,python打开文件后,是以什么样的形式储存在f这个对象里?还有python在读取文件的时候,对文本原有的编码方式是怎么应对的?
希望有朋友能指导一下,最好是像小甲鱼sisi的教程一样,通俗易懂,如果有相关文章,教程链接,还望共享一下,谢谢!!!
给你一个我珍藏多年的网址: http://www.cnblogs.com/evening/archive/2012/04/19/2457440.html
Python出现“gbk”说明是编码错误,也许可以考虑把代码的格式换成utf-8,在notepad++里面可以在“格式”里面直接转换
页:
[1]