python数据挖掘数据分析pandas的介绍及简单例子

zhangqinghao · 发表于 2017-2-20 18:43:31

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

pandas是Python下最有力的数据挖掘和数据分析的工具之一，支持类似于SQL的数据库的增、删、查、改，并且带有丰富的数据处理函数，支持时间序列的分析功能，支持灵活处理缺失数据。pandas基本的数据结构是Series和DataFrame，series就是序列，类似于一维数组，dataframe相当于一张二维的表格，类似于二维数组，它的每一列都相当于一个series，为了定位series中的元素，pandas提供了index对象，每个series都会带有一个对应的index，用来标记不同的元素，index的内容不一定是数字，也可以是字母、中文等，类似于SQL的主键，类似的，dataframe相当于带有多个同样的index的series的组合（本质上是series的容器），每个series都带有唯一的表头，用来标识不同的series。

import pandas as pd
s = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])
d2 = pd.DataFrame(s)
d.head()
d.describe()
print(d)
print(d2)
#pd.read_excel('data.xls')
#pd.read_csv('data.csv', encoding='utf-8')

复制代码

账号		自动登录	找回密码
密码			立即注册