鹿酸梅 发表于 2022-3-5 17:12:10

pandas打开不了文件,请大佬帮忙看看

import matplotlib

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp.csv')
data = pd.read_csv(f)
data.head()
报错提醒为:UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 149: illegal multibyte sequence

isdkz 发表于 2022-3-5 17:14:03

本帖最后由 isdkz 于 2022-3-5 17:20 编辑

编码问题,打开文件对象时指定一下编码就好
import matplotlib

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp.csv', encoding='utf-8-sig')   # 加上 encoding
data = pd.read_csv(f)
data.head()

鹿酸梅 发表于 2022-3-5 17:17:10

这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

鹿酸梅 发表于 2022-3-5 17:18:12

isdkz 发表于 2022-3-5 17:14
编码问题,打开文件对象时指定一下编码就好

这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

isdkz 发表于 2022-3-5 17:20:26

鹿酸梅 发表于 2022-3-5 17:18
这个我试了还是不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: inval ...

我改了,你再试试

鹿酸梅 发表于 2022-3-5 17:24:51

isdkz 发表于 2022-3-5 17:20
我改了,你再试试

不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

wp231957 发表于 2022-3-5 17:27:29

鹿酸梅 发表于 2022-3-5 17:24
不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

这玩意不能靠猜,你要确定一下你要打开的文档到底是啥编码格式

isdkz 发表于 2022-3-5 17:27:36

鹿酸梅 发表于 2022-3-5 17:24
不行
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x87 in position 10: invalid start byte

你先把你的csv文件用记事本打开,看一下右下角写的是什么编码

鹿酸梅 发表于 2022-3-5 17:29:19

isdkz 发表于 2022-3-5 17:27
你先把你的csv文件用记事本打开,看一下右下角写的是什么编码

ANSI

鹿酸梅 发表于 2022-3-5 17:29:58

wp231957 发表于 2022-3-5 17:27
这玩意不能靠猜,你要确定一下你要打开的文档到底是啥编码格式

是ANSI

isdkz 发表于 2022-3-5 17:36:32

本帖最后由 isdkz 于 2022-3-5 17:39 编辑

鹿酸梅 发表于 2022-3-5 17:29
ANSI

ANSI 就是 gbk 呀,为什么还会 gbk 解码错误,你确定你没看错吗?
import matplotlib

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
f = open('D:\\新建文件夹\\Folds5x2_pp (2).csv')
data = pd.read_csv(f)
data.head()

鹿酸梅 发表于 2022-3-5 17:44:58

isdkz 发表于 2022-3-5 17:36
ANSI 就是 gbk 呀,为什么还会 gbk 解码错误,你确定你没看错吗?

肯定没看错

isdkz 发表于 2022-3-6 15:06:54

鹿酸梅 发表于 2022-3-5 17:44
肯定没看错

方便把你的 csv 文件放上来吗?
页: [1]
查看完整版本: pandas打开不了文件,请大佬帮忙看看