鱼C论坛

 找回密码
 立即注册
查看: 969|回复: 4

pandas有没办法标准化处理数据

[复制链接]
发表于 2019-3-29 09:17:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
标准化数据处理有几种。。
想请教的是,pandas中有没简单的z-score标准化处理数据?
我网搜过,用sklearn包中的preprocessing..
d2 = prs.scale(~d1['列名)'].isnull())  #对d1列中的非空值进行标准化处理,因为该原始列中含有异常值和缺失值,我的想法是先找出异常值(标准化后的值大于3的),将其替换为空值后,再与原始的空值一起进行填充处理
但是实际出来的结果,是非空值的结果都是同一个数字,而空值同样有标准化后的数据(数字也是同一值)。。
请教下,正确的具体语句该怎么写。。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2019-3-29 09:24:59 | 显示全部楼层
如果用d2 = d1['列名'].apply(lambda x: (x-np.mean(x))/np.std(x))来处理的话,生成的d2则全是空值。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-8 08:32:12 | 显示全部楼层
iwanna 发表于 2019-4-6 21:13
用scipy的函数:

对列进行标准化的话apply(ss.zscore,axis=0)

我按照你的办法去标准化了数据,提示:must be str, not float
没搞懂这个什么意思了。。数据标准化处理,不就是要原始数据为数值型的么?
为什么会报这个错?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-14 21:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表