[已解决]关于read函数的一些问题

雨留下的印记 · 发表于 2020-4-7 20:43:45

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由雨留下的印记于 2020-4-7 21:11 编辑

不能传图片比较麻烦，只能复试过来，大佬们将就看一下
我创建了一个txt文本
用open打开没问题，但是用read函数读取时候会报错。
>>>a = open('D:\\ccc.txt')
>>> a
<_io.TextIOWrapper name='D:\\ccc.txt' mode='r' encoding='cp936'>
>>> a.read()
Traceback (most recent call last):
  File "<pyshell#3>", line 1, in <module>
a.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 26: illegal multibyte sequence
红色的是报错原因

当时我看弹幕说加encoding = 'UTF-8' ,我加了确实可以read了,有大佬告诉我这是什么原因嘛?
>>> a = open('D:\\ccc.txt',encoding = 'UTF-8')
>>> a.read()
'我曾经爱过这样一个男人\n他说我是世上最美的女人\n我为他保留着那一份天真\n关上爱别人的门\n也是这个被我深爱的男人\n把我变为世上最笨的女人\n他说的话我都会当真\n他说最爱我的唇\n我的要求并不高\n待我像从前一样好\n可是有一天你说了同样的话\n把别人拥入怀抱'

以及疑问问题,上课的时候我记得小甲鱼说的是一个文字占用2个字节,这里我想要说的问题不太好用文字描述,还是直接上代码把
a = open('D:\\ccc.txt',encoding = 'UTF-8')
>>> a.seek(0,0)
0
>>> a.seek(2,0)
2
>>> a.readline()
Traceback (most recent call last):
  File "<pyshell#16>", line 1, in <module>
a.readline()
  File "C:\Users\cwj\AppData\Local\Programs\Python\Python38\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x91 in position 0: invalid start byte
我的文本是只有文字的,没有数字和其他符号

而我用下面这个方法来读取时,却可以
>>> a.seek(0,0)
0
>>> a.seek(3,0)
3
>>> a.readline()
'曾经爱过这样一个男人\n'
>>>
这是不是意味着一个文字占用着三个字节,或者说是我哪里理解出了问题.

'w' 以写入的方式打开文件，会覆盖已存在的文件
'x' 如果文件已经存在，使用此模式打开将引发异常
还有关于x,和w打开文件的区别,
这样讲的我有点迷糊,能给我详细讲解下嘛,
谢谢了

最佳答案

月排行榜 / 总排行榜

BngThea

2020-4-7 20:51:00

1 默认open函数使用的编码方式不认识中文
2 文字其实是占三个字节

跳转到最佳答案楼层

BngThea · 发表于 2020-4-7 20:51:00

这个最佳答案由 BngThea 给出，感谢 BngThea 的回答。

单击隐藏图章

1 默认open函数使用的编码方式不认识中文
2 文字其实是占三个字节

账号		自动登录	找回密码
密码			立即注册