|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 effy1995 于 2018-3-3 18:38 编辑
想从一个csv的表中从第二行和第二列开始,(如果出现0值则排除)找出最大值(max)、最小值(min)、平均值(mean)和标准差,然后建立一个新表,再计算新表数据max,min的平均值以及所有数据的方差。
由于是小白暂时还没学过pandas库,可能会有很多错误,还希望各位大佬们耐心回答~
- import pandas as pd
- import numpy as np
- import os
- data_path='C:/field//'
- field_lst=['caijue']
- for each in field_lst:
- df = pd.DataFrame(pd.read_csv(data_path + each + '.csv',header=1))
- df.drop(0,axis=0)
- df.drop(0,axis=1)
- index=df.each[0:]
- #for i in each:
- #if index != 0:
- #df.groupby(index)['data1','data2'].agg(['min','max'])
- #df.groupby(index).agg({'data1':'min','data2':'max'})
- maximum=index_df.max(index)
- minimum=index_df.min(index)
- field_mean = index_df.mean(index)
- field_std = index_df.std(index)
- df = pd.DataFrame({"id":[1001,1002,1003,1004,1005],
- 'field':[each],
- 'max':[maximum],
- 'min':[minimum],
- 'mean':[field_mean],
- 'standard deviation':[field_std]},
- columns =['id','field','max','min','mean','standard deviation'])
- df_inner.groupby('field')['max']['min'].agg([len, np.mean])
- df_inner.to_excel('excel_to_python.xlsx', sheet_name='field summary')
复制代码 |
-
|