鱼C论坛

 找回密码
 立即注册
查看: 3554|回复: 0

[技术交流] Pandas的数据清洗——构造NaN数据与查看

[复制链接]
发表于 2020-12-15 14:19:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
Pandas的数据清洗——构造NaN数据
在Pandas的各类数据Series和DataFrame里字段值为NaN的为缺失数据,
不代表0而是说没有赋值数据。数据的缺失有很多原因,缺失不是错误、无效,
需要对缺失的数据进行必要的技术处理,以便后续的计算、统计

  1. import pandas as pd
  2. import numpy as np
  3. val = np.arange(10, 38).reshape(7, 4)
  4. col = list("abcd")
  5. idx = "cake make fake sake wake lake take".split()
  6. df = pd.DataFrame(val, columns = col, index = idx)
  7. print df
  8. df["e"] = np.nan
  9. df.at["make", "e"] = 100
  10. df.at["wake", "e"] = 300
  11. df.loc["jake"] = np.nan
  12. df.at["jake", "c"] = 200
  13. df["f"] = np.nan
  14. print (df)
  15. # 下面是查看NaN数据
  16. # 查看缺失数据的情况可以用pandas的isnull函数看看有那些字段上的数据缺失,
  17. # 可以用sum进行统计。也可使用notnull和count函数统计非NaN数据量。
  18. print ("which has Nan?\n", df.isnull(),"\n")
  19. print ("each column has NaN\n", df.isnull().sum(),"\n")
  20. print ("total has NaN\n", df.isnull().sum().sum(),"\n")
  21. print ("each column values\n", df.count(),"\n")
  22. print ("which column values\n", df.notnull())
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-30 09:57

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表