pandas打开不了文件,请大佬帮忙看看
import matplotlibimport matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp.csv')
data = pd.read_csv(f)
data.head()
报错提醒为:UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 149: illegal multibyte sequence
本帖最后由 isdkz 于 2022-3-5 17:20 编辑
编码问题,打开文件对象时指定一下编码就好
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp.csv', encoding='utf-8-sig') # 加上 encoding
data = pd.read_csv(f)
data.head() 这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte isdkz 发表于 2022-3-5 17:14
编码问题,打开文件对象时指定一下编码就好
这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte 鹿酸梅 发表于 2022-3-5 17:18
这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: inval ...
我改了,你再试试 isdkz 发表于 2022-3-5 17:20
我改了,你再试试
不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte 鹿酸梅 发表于 2022-3-5 17:24
不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte
这玩意不能靠猜,你要确定一下你要打开的文档到底是啥编码格式 鹿酸梅 发表于 2022-3-5 17:24
不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte
你先把你的csv文件用记事本打开,看一下右下角写的是什么编码 isdkz 发表于 2022-3-5 17:27
你先把你的csv文件用记事本打开,看一下右下角写的是什么编码
ANSI wp231957 发表于 2022-3-5 17:27
这玩意不能靠猜,你要确定一下你要打开的文档到底是啥编码格式
是ANSI 本帖最后由 isdkz 于 2022-3-5 17:39 编辑
鹿酸梅 发表于 2022-3-5 17:29
ANSI
ANSI 就是 gbk 呀,为什么还会 gbk 解码错误,你确定你没看错吗?
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp (2).csv')
data = pd.read_csv(f)
data.head() isdkz 发表于 2022-3-5 17:36
ANSI 就是 gbk 呀,为什么还会 gbk 解码错误,你确定你没看错吗?
肯定没看错 鹿酸梅 发表于 2022-3-5 17:44
肯定没看错
方便把你的 csv 文件放上来吗?
页:
[1]