|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 雨留下的印记 于 2020-4-7 21:11 编辑
不能传图片比较麻烦,只能复试过来,大佬们将就看一下
我创建了一个txt文本
用open打开没问题,但是用read函数读取时候会报错。
>>>a = open('D:\\ccc.txt')
>>> a
<_io.TextIOWrapper name='D:\\ccc.txt' mode='r' encoding='cp936'>
>>> a.read()
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <module>
a.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 26: illegal multibyte sequence
红色的是报错原因
当时我看弹幕说加encoding = 'UTF-8' ,我加了确实可以read了,有大佬告诉我这是什么原因嘛?
>>> a = open('D:\\ccc.txt',encoding = 'UTF-8')
>>> a.read()
'我曾经爱过这样一个男人\n他说我是世上最美的女人\n我为他保留着那一份天真\n关上爱别人的门\n也是这个被我深爱的男人\n把我变为世上最笨的女人\n他说的话我都会当真\n他说最爱我的唇\n我的要求并不高\n待我像从前一样好\n可是有一天你说了同样的话\n把别人拥入怀抱'
以及疑问问题,上课的时候我记得小甲鱼说的是一个文字占用2个字节,这里我想要说的问题不太好用文字描述,还是直接上代码把
a = open('D:\\ccc.txt',encoding = 'UTF-8')
>>> a.seek(0,0)
0
>>> a.seek(2,0)
2
>>> a.readline()
Traceback (most recent call last):
File "<pyshell#16>", line 1, in <module>
a.readline()
File "C:\Users\cwj\AppData\Local\Programs\Python\Python38\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x91 in position 0: invalid start byte
我的文本是只有文字的,没有数字和其他符号
而我用下面这个方法来读取时,却可以
>>> a.seek(0,0)
0
>>> a.seek(3,0)
3
>>> a.readline()
'曾经爱过这样一个男人\n'
>>>
这是不是意味着一个文字占用着三个字节,或者说是我哪里理解出了问题.
'w' 以写入的方式打开文件,会覆盖已存在的文件
'x' 如果文件已经存在,使用此模式打开将引发异常
还有关于x,和w打开文件的区别,
这样讲的我有点迷糊,能给我详细讲解下嘛,
谢谢了
1 默认open函数使用的编码方式不认识中文
2 文字其实是占三个字节
|
|