EveLee 发表于 2020-4-3 16:24:44

28讲课后题文件始终打不开

>>> f1 = open('D://呀呀.docx')
>>> f1.readline()
Traceback (most recent call last):
File "<pyshell#1>", line 1, in <module>
    f1.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xc2 in position 89: illegal multibyte sequence

文件是一个我自己创建的直接放在D盘下的只有2行文字(包括汉字和标点符号)的文件。上面和下面这2种格式都报错打不开

>>> f1 = open('D://呀呀.docx',encoding='UTF-8')
>>> f1.readline()
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <module>
    f1.readline()
File "C:\Users\lizha\AppData\Local\Programs\Python\Python38\lib\codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

qiuyouzhi 发表于 2020-4-3 16:29:49

本帖最后由 qiuyouzhi 于 2020-4-3 16:31 编辑

那个文件不是一个文本文件(.txt)吗?
怎么变成Word文件了。。。

EveLee 发表于 2020-4-3 16:32:23

qiuyouzhi 发表于 2020-4-3 16:29
那个文件不是一个文本文件(.txt)吗?
怎么变成Word文件了。。。

是用WPS创建的一个文件,docx格式的

qiuyouzhi 发表于 2020-4-3 16:33:57

EveLee 发表于 2020-4-3 16:32
是用WPS创建的一个文件,docx格式的

作业应该是要读取txt文件的
要读取Word文件就得用别的方法

EveLee 发表于 2020-4-3 16:36:07

qiuyouzhi 发表于 2020-4-3 16:33
作业应该是要读取txt文件的
要读取Word文件就得用别的方法

刚刚用txt文件试了一下,可以打开了。那word文件应该怎么打开呢?

qiuyouzhi 发表于 2020-4-3 16:37:26

EveLee 发表于 2020-4-3 16:36
刚刚用txt文件试了一下,可以打开了。那word文件应该怎么打开呢?

用Python-docx模块
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=Python%20%E5%A6%82%E4%BD%95%E8%AF%BB%E5%8F%96docx&rsv_t=55ba5CVuad%2BFPG%2B3g1vetohEvICnEJHRhpDIgI63vTIPSixa7ifqa%2FKiI8Y&rsv_enter=1&rsv_dl=tb&rsv_sug3=27&rsv_sug1=14&rsv_sug7=100&rsv_sug2=0&inputT=27763&rsv_sug4=27763
刚才简单看了一下,又要分一级标题,又要分二级标题
很麻烦的

EveLee 发表于 2020-4-3 16:39:28

qiuyouzhi 发表于 2020-4-3 16:37
用Python-docx模块
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=Python%20%E ...

好咧,谢谢,我还以为不同格式的文件都可以这样简单的打开{:10_257:}
页: [1]
查看完整版本: 28讲课后题文件始终打不开