Cria 发表于 2020-4-12 23:31:23

关于数据处理。。

本帖最后由 Cria 于 2020-4-14 23:17 编辑

编程实现:
1.使用Python读取附件mtcars数据集并实现以下操作
1)查看mtcars数据集的维度和大小等信息
2)使用describe方法对整个mtcars数据集进行描述性统计
3)计算不同cyl(汽缸数)、carb(化油器)对应的mpg(油耗)和hp(马力)的均值。





结果放在附件了,用jupyter notebook打开,感谢各位的回帖!!!

zero_sunshine 发表于 2020-4-12 23:31:24

我不记得什么是维度和大小信息了,所以没写,剩下两个操作利用pandas都可以很容易实现


import pandas as pd

m = pd.read_csv('mtcars.csv')#读取文件
des = m.describe()#使用describe描述统计信息
mea = m[['mpg','hp']].groupby(,m['carb']]).mean()#计算不同 mpg 和 hp 在不同 cyl 和 carb 下的均值

print(des)
print(mea)
--------------------------------------------------------
执行结果:
             mpg      cyl      disp...         am       gear   carb
count32.00000032.000000   32.000000...32.00000032.00000032.0000
mean   20.090625   6.187500230.721875...   0.406250   3.687500   2.8125
std   6.026948   1.785922123.938694...   0.498991   0.737804   1.6152
min    10.400000   4.000000   71.100000...   0.000000   3.000000   1.0000
25%    15.425000   4.000000120.825000...   0.000000   3.000000   2.0000
50%    19.200000   6.000000196.300000...   0.000000   4.000000   2.0000
75%    22.800000   8.000000326.000000...   1.000000   4.000000   4.0000
max    33.900000   8.000000472.000000...   1.000000   5.000000   8.0000


            mpg   hp
cyl carb            
4   1   27.58   77.4
    2   25.90   87.0
6   1   19.75107.5
    4   19.75116.5
    6   19.70175.0
8   2   17.15162.5
    3   16.30180.0
    4   13.15234.0
    8   15.00335.0

陈尚涵 发表于 2020-4-13 13:26:18

貌似,有点难,那个,先撤啦!

wjhdexiaoxiaoha 发表于 2020-4-13 16:01:13

接一楼:
直接m.shape就可以知道m的维度了

永恒的蓝色梦想 发表于 2020-4-13 16:16:31

陈尚涵 发表于 2020-4-13 13:26
貌似,有点难,那个,先撤啦!

灌水,举报了

会计的会怎么念 发表于 2020-4-13 17:29:08

1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape,你说的大小是文件大小的话用os模块,
4. 对于pandas的DataFrame对象,每一列就是一个Series对象,
5. 用列索引索引你的想要计算平均值的特征,一个.mean()就出来了
6. 这个视频教程可以学一下[https://www.bilibili.com/video/BV1hx411d7jb?from=search&seid=15742128318702931362]
7. 北京理工大学,MOOC,嵩天老师也有相关课程。

Cria 发表于 2020-4-13 19:11:21

会计的会怎么念 发表于 2020-4-13 17:29
1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape ...

非常感谢

zero_sunshine 发表于 2020-4-15 09:29:03

wjhdexiaoxiaoha 发表于 2020-4-13 16:01
接一楼:
直接m.shape就可以知道m的维度了

{:10_298:}
页: [1]
查看完整版本: 关于数据处理。。