鱼C论坛

 找回密码
 立即注册
查看: 1352|回复: 6

[已解决]文本提取

[复制链接]
发表于 2020-11-18 16:47:32 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
with open('digits.txt') as aa:
    contents=aa.read()
    print(contents)
文件都存储到aa.py的同一个文件夹里了 问什么报错呢
最佳答案
2020-11-18 17:37:12
lsykkk 发表于 2020-11-18 17:28
Traceback (most recent call last):
  File "/Users/lsy/Documents/pythonlsy/aa.py", line 2, in
...


重新保存下 TXT 文本,如果选择 UTF-8 那么就要加上 encoding = 'utf-8' 参数

如果嫌麻烦就直接选择 ANSI 编码报错,ANSI 国内大部分电脑默认 gbk 编码,Python 的open 参数也是默认 gbk 编码 就不用加参数


                               
登录/注册后可看大图



                               
登录/注册后可看大图



                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-18 16:52:37 | 显示全部楼层
所以报错是啥啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-18 16:57:47 | 显示全部楼层

报错建议发下报错内容哈

可能是编码报错吧,在 open 里加上参数 encoding = 'UTF-8'试试看

参考代码:

  1. with open('digits.txt' , encoding = 'UTF-8') as aa:
  2.     contents=aa.read()
  3.     print(contents)
复制代码

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-18 17:09:34 | 显示全部楼层
Traceback (most recent call last):
  File "/Users/lsy/Documents/pythonlsy/aa.py", line 2, in <module>
    contents=aa.read()
  File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
>>>
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-18 17:28:14 | 显示全部楼层
Twilight6 发表于 2020-11-18 16:57
报错建议发下报错内容哈

可能是编码报错吧,在 open 里加上参数 encoding = 'UTF-8'试试看


Traceback (most recent call last):
  File "/Users/lsy/Documents/pythonlsy/aa.py", line 2, in <module>
    contents=aa.read()
  File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
>>>
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-18 17:29:27 | 显示全部楼层
昨非 发表于 2020-11-18 16:52
所以报错是啥啊


Traceback (most recent call last):
  File "/Users/lsy/Documents/pythonlsy/aa.py", line 2, in <module>
    contents=aa.read()
  File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
>>>
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-18 17:37:12 | 显示全部楼层    本楼为最佳答案   
lsykkk 发表于 2020-11-18 17:28
Traceback (most recent call last):
  File "/Users/lsy/Documents/pythonlsy/aa.py", line 2, in
...


重新保存下 TXT 文本,如果选择 UTF-8 那么就要加上 encoding = 'utf-8' 参数

如果嫌麻烦就直接选择 ANSI 编码报错,ANSI 国内大部分电脑默认 gbk 编码,Python 的open 参数也是默认 gbk 编码 就不用加参数


                               
登录/注册后可看大图



                               
登录/注册后可看大图



                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-1 17:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表