鱼C论坛

 找回密码
 立即注册
查看: 1176|回复: 3

[已解决]大佬们,我的问题多,求助啊

[复制链接]
发表于 2018-4-1 20:08:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
大佬们,我的这个文档怎么read不了啊。。
A = ('C:\\Users\\think\\Desktop\\升学文书\\America\\伯明顿.docx')
>>> a = open(A)
>>> a
<_io.TextIOWrapper name='C:\\Users\\think\\Desktop\\升学文书\\America\\伯明顿.docx' mode='r' encoding='cp936'>
>>> a.read()
Traceback (most recent call last):
  File "<pyshell#3>", line 1, in <module>
    a.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0x82 in position 89: illegal multibyte sequence
最佳答案
2018-4-1 20:11:12
.docx是word文档。有专门的模块操作。
open是用来操作 文本 和 二制的。
先学着吧!没你想的那么简单
不是一个open就什么都能干。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-4-1 20:11:12 | 显示全部楼层    本楼为最佳答案   
.docx是word文档。有专门的模块操作。
open是用来操作 文本 和 二制的。
先学着吧!没你想的那么简单
不是一个open就什么都能干。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-1 20:13:18 | 显示全部楼层
乱码了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-1 20:26:10 | 显示全部楼层
open打不开word,

import docx
A = docx.Document(文件路径)
a = '\n\n'.join([
    paragraph.text.encode('utf-8') for paragraph in A.paragraphs
])
print a
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-28 04:08

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表