鱼C论坛

 找回密码
 立即注册
查看: 3403|回复: 7

[已解决]关于数据处理。。

[复制链接]
发表于 2020-4-12 23:31:23 | 显示全部楼层 |阅读模式
20鱼币
本帖最后由 Cria 于 2020-4-14 23:17 编辑

编程实现:
1.使用Python读取附件mtcars数据集并实现以下操作
1)  查看mtcars数据集的维度和大小等信息
2)使用describe方法对整个mtcars数据集进行描述性统计
3)计算不同cyl(汽缸数)、carb(化油器)对应的mpg(油耗)和hp(马力)的均值。






结果放在附件了,用jupyter notebook打开,感谢各位的回帖!!!
最佳答案
2020-4-12 23:31:24
我不记得什么是维度和大小信息了,所以没写,剩下两个操作利用pandas都可以很容易实现


import pandas as pd

m = pd.read_csv('mtcars.csv')#读取文件
des = m.describe()#使用describe描述统计信息
mea = m[['mpg','hp']].groupby([m['cyl'],m['carb']]).mean()#计算不同 mpg 和 hp 在不同 cyl 和 carb 下的均值

print(des)
print(mea)
--------------------------------------------------------
执行结果:
             mpg        cyl        disp  ...         am       gear     carb
count  32.000000  32.000000   32.000000  ...  32.000000  32.000000  32.0000
mean   20.090625   6.187500  230.721875  ...   0.406250   3.687500   2.8125
std     6.026948   1.785922  123.938694  ...   0.498991   0.737804   1.6152
min    10.400000   4.000000   71.100000  ...   0.000000   3.000000   1.0000
25%    15.425000   4.000000  120.825000  ...   0.000000   3.000000   2.0000
50%    19.200000   6.000000  196.300000  ...   0.000000   4.000000   2.0000
75%    22.800000   8.000000  326.000000  ...   1.000000   4.000000   4.0000
max    33.900000   8.000000  472.000000  ...   1.000000   5.000000   8.0000

[8 rows x 11 columns]
            mpg     hp
cyl carb              
4   1     27.58   77.4
    2     25.90   87.0
6   1     19.75  107.5
    4     19.75  116.5
    6     19.70  175.0
8   2     17.15  162.5
    3     16.30  180.0
    4     13.15  234.0
    8     15.00  335.0

mtcars.rar

1006 Bytes, 下载次数: 29

mtcars结果.rar

2.67 KB, 下载次数: 19

这是答案

最佳答案

查看完整内容

我不记得什么是维度和大小信息了,所以没写,剩下两个操作利用pandas都可以很容易实现 import pandas as pd m = pd.read_csv('mtcars.csv')#读取文件 des = m.describe()#使用describe描述统计信息 mea = m[['mpg','hp']].groupby([m['cyl'],m['carb']]).mean()#计算不同 mpg 和 hp 在不同 cyl 和 carb 下的均值 print(des) print(mea) -------------------------------------------------------- 执行结果: ...
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-12 23:31:24 | 显示全部楼层    本楼为最佳答案   
我不记得什么是维度和大小信息了,所以没写,剩下两个操作利用pandas都可以很容易实现


import pandas as pd

m = pd.read_csv('mtcars.csv')#读取文件
des = m.describe()#使用describe描述统计信息
mea = m[['mpg','hp']].groupby([m['cyl'],m['carb']]).mean()#计算不同 mpg 和 hp 在不同 cyl 和 carb 下的均值

print(des)
print(mea)
--------------------------------------------------------
执行结果:
             mpg        cyl        disp  ...         am       gear     carb
count  32.000000  32.000000   32.000000  ...  32.000000  32.000000  32.0000
mean   20.090625   6.187500  230.721875  ...   0.406250   3.687500   2.8125
std     6.026948   1.785922  123.938694  ...   0.498991   0.737804   1.6152
min    10.400000   4.000000   71.100000  ...   0.000000   3.000000   1.0000
25%    15.425000   4.000000  120.825000  ...   0.000000   3.000000   2.0000
50%    19.200000   6.000000  196.300000  ...   0.000000   4.000000   2.0000
75%    22.800000   8.000000  326.000000  ...   1.000000   4.000000   4.0000
max    33.900000   8.000000  472.000000  ...   1.000000   5.000000   8.0000

[8 rows x 11 columns]
            mpg     hp
cyl carb              
4   1     27.58   77.4
    2     25.90   87.0
6   1     19.75  107.5
    4     19.75  116.5
    6     19.70  175.0
8   2     17.15  162.5
    3     16.30  180.0
    4     13.15  234.0
    8     15.00  335.0

评分

参与人数 1荣誉 +3 贡献 +3 收起 理由
Cria + 3 + 3 感谢楼主无私奉献!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-13 13:26:18 | 显示全部楼层
貌似,有点难,那个,先撤啦!
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-13 16:01:13 | 显示全部楼层
接一楼:
直接m.shape就可以知道m的维度了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-13 16:16:31 | 显示全部楼层
陈尚涵 发表于 2020-4-13 13:26
貌似,有点难,那个,先撤啦!

灌水,举报了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-13 17:29:08 | 显示全部楼层
1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape,你说的大小是文件大小的话用os模块,
4. 对于pandas的DataFrame对象,每一列就是一个Series对象,
5. 用列索引索引你的想要计算平均值的特征,一个.mean()就出来了
6. 这个视频教程可以学一下[https://www.bilibili.com/video/B ... 5742128318702931362]
7. 北京理工大学,MOOC,嵩天老师也有相关课程。

评分

参与人数 1荣誉 +1 鱼币 +1 贡献 +1 收起 理由
Cria + 1 + 1 + 1 感谢楼主无私奉献!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-13 19:11:21 | 显示全部楼层
会计的会怎么念 发表于 2020-4-13 17:29
1. pandas能解决你上面所有问题,
2. 读取csv直接用pd.read_csv(filename)
3. 查看数据维度用属性.shape ...

非常感谢
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-4-15 09:29:03 | 显示全部楼层
wjhdexiaoxiaoha 发表于 2020-4-13 16:01
接一楼:
直接m.shape就可以知道m的维度了

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-14 16:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表