wk934530 发表于 2020-11-12 20:00:05

x = data.iloc[:,:3].astype(int)代表什么意思

import pandas as pd
import numpy as np
filename = r'D:\python\chapter5\demo\data\sales_data.xls'
data = pd.read_excel(filename,index_col='序号')   #导入数据

#数据是类别得标签,转换为数据
#用1来表示“好”“是”“高”这三个属性,用-1表示 坏、否、低
data =1
data =1
data =1
data = -1
x = data.iloc[:,:3].astype(int)
y = data.iloc[:,3].astype(int)
from sklearn.tree import DecisionTreeClassifier as DTC
dtc = DTC(criterion='entropy')#建立决策树模型,基于信息熵
dtc.fit(x,y)    #训练模型

from sklearn.tree import export_graphviz    #导入相关函数,可视化决策树
x=pd.DataFrame(x)
with open('C:\\Users\\13783\\Desktop\\tree1.dot','w') as f: #导出dot文件
    f = export_graphviz(dtc,feature_names=x.columns ,out_file=f)

x = data.iloc[:,:3].astype(int)
y = data.iloc[:,3].astype(int)
f = export_graphviz(dtc,feature_names=x.columns ,out_file=f)
x = data.iloc[:,:3].as_matrix().astype(int)
这四行代码表达了啥意思

疾风怪盗 发表于 2020-11-12 21:55:39

x = data.iloc[:,:3].astype(int)
这个是取出data的第0,1,2列的所有行,并转换为int类型吧
y = data.iloc[:,3].astype(int)
这个是取出data的第3列数据(所有行),并转换为int类型吧
后面就不知道了,涉及到决策树

proer 发表于 2020-11-12 22:01:59

第一行 取data的前三列所有数据,并且把里面的值都转换为整型
第二行 取data的第四列所有数据,并且把里面的值都转换为整型
第三行 可视化训练好的决策树
第四行和第一行差不多,只不过把DataFrame变成了array

wk934530 发表于 2020-11-12 23:15:22

疾风怪盗 发表于 2020-11-12 21:55
这个是取出data的第0,1,2列的所有行,并转换为int类型吧

这个是取出data的第3列数据(所有行),并 ...

好的,谢谢您
页: [1]
查看完整版本: x = data.iloc[:,:3].astype(int)代表什么意思