鱼C论坛

 找回密码
 立即注册
查看: 677|回复: 3

[已解决]UnicodeDecodeError

[复制链接]
发表于 2018-7-27 16:40:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
处理txt文档的数据时候出现解码问题
  1. import sys
  2. import re
  3. args=sys.argv
  4. sum_list=[]
  5. alist=[]
  6. unmatch_list=[]
  7. with open(args[1],"r",encoding="utf-8") as f:
  8.     for line in f:
  9.         line=line.strip("\n").split("\t")
  10.         symbol=line[1]
  11.         alist.append(symbol)
  12.         if line[8]:
  13.             alias_symbol=line[8].split("|")
  14.             for i in alias_symbol:
  15.                 alist.append(i)
  16.         if line[10]:
  17.             prev_symbol=line[10].split("|")
  18.             for i in prev_symbol:
  19.                 alist.append(i)
  20.     sum_list.append(alist)
  21.     alist.clear()
复制代码


Traceback (most recent call last):
  File "C:/Users/likuokuo/PycharmProjects/python/p_value.py", line 10, in <module>
    for line in f:
  File "C:\Users\likuokuo\AppData\Local\Programs\Python\Python35\lib\codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 6015-6016: invalid continuation byte
最佳答案
2018-7-27 22:42:35
2018727_224202.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-7-27 16:46:33 | 显示全部楼层
utf8无法解释第6015-6016字节的字符,建议用自动识别。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-27 22:42:35 | 显示全部楼层    本楼为最佳答案   
2018727_224202.png
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-9 22:18:42 | 显示全部楼层
无符号整形 发表于 2018-7-27 16:46
utf8无法解释第6015-6016字节的字符,建议用自动识别。

怎么自动识别
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-24 04:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表