鱼C论坛

 找回密码
 立即注册
查看: 805|回复: 3

关于数据的线性插值法应用

[复制链接]
发表于 2019-4-2 14:41:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 老笨啊 于 2019-4-2 14:42 编辑

手头有几组数据,大致情况是这样的:
1. 数据的组别较多,每个组别的数据量不一。每个组别或多或少都有缺失值存在(异常值暂时不考虑);
2. 每个组别的数据中,有不同类别的数据。需要对每个类别的缺失值用线性插值法来填充。---每个组别数据差距可能较大,所以填充时,必须先对组分类,再对类别分类,才能进行填充处理。
我的代码如下:
  1. for x1 in d1.企业名称.unique():
  2.     for x2 in d1.columns[3:]:
  3.         d1[d1.企业名称 ==x1][x2].interpolate(inplace = True)
复制代码


情况类似如下图片:
1.jpg

个人觉得这个命令执行完,就可以进行线性插值法填充了,可是实际执行完,我用d1.isnull().sum()来查看缺失值的统计数据时,发现缺失值并没有被填充。。想请教下高手,到底哪里出了问题。。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2019-4-2 15:05:35 | 显示全部楼层
简单来说,就是先对企业进行分类,再根据不同组别,进行纵向填充
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-3 09:43:01 | 显示全部楼层
求各位高手,帮忙解惑。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-15 00:57

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表