鱼C论坛

 找回密码
 立即注册
查看: 1987|回复: 0

[技术交流] Pandas的数据清洗——构造NaN数据与查看

[复制链接]
发表于 2020-12-15 14:19:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
Pandas的数据清洗——构造NaN数据
在Pandas的各类数据Series和DataFrame里字段值为NaN的为缺失数据,
不代表0而是说没有赋值数据。数据的缺失有很多原因,缺失不是错误、无效,
需要对缺失的数据进行必要的技术处理,以便后续的计算、统计
import pandas as pd
import numpy as np
val = np.arange(10, 38).reshape(7, 4)
col = list("abcd")
idx = "cake make fake sake wake lake take".split()
df = pd.DataFrame(val, columns = col, index = idx)
print df
df["e"] = np.nan
df.at["make", "e"] = 100
df.at["wake", "e"] = 300
df.loc["jake"] = np.nan
df.at["jake", "c"] = 200
df["f"] = np.nan
print (df)
# 下面是查看NaN数据
# 查看缺失数据的情况可以用pandas的isnull函数看看有那些字段上的数据缺失,
# 可以用sum进行统计。也可使用notnull和count函数统计非NaN数据量。
print ("which has Nan?\n", df.isnull(),"\n")
print ("each column has NaN\n", df.isnull().sum(),"\n")
print ("total has NaN\n", df.isnull().sum().sum(),"\n")
print ("each column values\n", df.count(),"\n")
print ("which column values\n", df.notnull())
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-17 01:12

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表