关于数据处理。。
本帖最后由 Cria 于 2020-4-14 23:17 编辑编程实现:
1.使用Python读取附件mtcars数据集并实现以下操作
1)查看mtcars数据集的维度和大小等信息
2)使用describe方法对整个mtcars数据集进行描述性统计
3)计算不同cyl(汽缸数)、carb(化油器)对应的mpg(油耗)和hp(马力)的均值。
结果放在附件了,用jupyter notebook打开,感谢各位的回帖!!! 我不记得什么是维度和大小信息了,所以没写,剩下两个操作利用pandas都可以很容易实现
import pandas as pd
m = pd.read_csv('mtcars.csv')#读取文件
des = m.describe()#使用describe描述统计信息
mea = m[['mpg','hp']].groupby(,m['carb']]).mean()#计算不同 mpg 和 hp 在不同 cyl 和 carb 下的均值
print(des)
print(mea)
--------------------------------------------------------
执行结果:
mpg cyl disp... am gear carb
count32.00000032.000000 32.000000...32.00000032.00000032.0000
mean 20.090625 6.187500230.721875... 0.406250 3.687500 2.8125
std 6.026948 1.785922123.938694... 0.498991 0.737804 1.6152
min 10.400000 4.000000 71.100000... 0.000000 3.000000 1.0000
25% 15.425000 4.000000120.825000... 0.000000 3.000000 2.0000
50% 19.200000 6.000000196.300000... 0.000000 4.000000 2.0000
75% 22.800000 8.000000326.000000... 1.000000 4.000000 4.0000
max 33.900000 8.000000472.000000... 1.000000 5.000000 8.0000
mpg hp
cyl carb
4 1 27.58 77.4
2 25.90 87.0
6 1 19.75107.5
4 19.75116.5
6 19.70175.0
8 2 17.15162.5
3 16.30180.0
4 13.15234.0
8 15.00335.0 貌似,有点难,那个,先撤啦! 接一楼:
直接m.shape就可以知道m的维度了 陈尚涵 发表于 2020-4-13 13:26
貌似,有点难,那个,先撤啦!
灌水,举报了
1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape,你说的大小是文件大小的话用os模块,
4. 对于pandas的DataFrame对象,每一列就是一个Series对象,
5. 用列索引索引你的想要计算平均值的特征,一个.mean()就出来了
6. 这个视频教程可以学一下[https://www.bilibili.com/video/BV1hx411d7jb?from=search&seid=15742128318702931362]
7. 北京理工大学,MOOC,嵩天老师也有相关课程。 会计的会怎么念 发表于 2020-4-13 17:29
1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape ...
非常感谢 wjhdexiaoxiaoha 发表于 2020-4-13 16:01
接一楼:
直接m.shape就可以知道m的维度了
{:10_298:}
页:
[1]