首页 > 编程知识 正文

决策树算法例题,python爬虫实例教程

时间:2023-05-06 13:09:49 阅读:46760 作者:2507

目录

1、概念

2决策树生成方法

3、决策树的绘制方法

4、案例代码示例

1、概念决策树(诊断树)。

他通过学习训练样本,建立分类规则,将新样本数据分类,属于有监督的学习

决策树也是一种多功能的机器学习算法,它是可能的

实现分类和回归任务,甚至多输出任务。

好处:

决策树容易理解和实现

决策树可以处理数值型和非数值型的数据

2决策树生成方法# dt model=decisiontreeclassifier (max _ leaf _ nodes=none ) ) ) ) ) ) )。

max_leaf_nodes的最大叶节点数

##培训模式

dtmodel.fit(featuredata,targetData ) )。

featuereData属性数据

目标数据目标数据

# # # dt模式. predict (featuredata ) )。

featureData属性数据

3、决策树绘制方法sklearn.tree.export_graphviz(…)

dtModel决策树模型

out_file图形数据的输出路径

class_names目标属性名称,中文

feature_names特征属性名称中文

是否要用filled=Ture颜色填充

rounded=TRUE边框是否采用圆角边框

special_characters中有特殊字符吗

4、案例代码例升学意愿调查——

注释列

studentID学生ID

GEnder性别

父信息父代的收入

智商智商

父项会计的父母在鼓励吗

ColegePlans打算上大学吗

目的:改变决策树图形,用于导师判断一个学生是否有升学意愿

导入熊猫; data=pandas.read _ CSV (d :\ data\ py casenumber2 5.3\ data.CSV ) #将虚拟变量转换为数字变量。 这里有性别和有无' parent encouragement ' ' forcolumnindummycolumns 3360 data [ column ]=data [ column ].as type (category ) dumns prefix=dummyColumns,prefix_sep='=',drop_first=True ) #表示已在列表中选择dummies data.columns # ' IQ ',' genen ' parent encouragement=not encouraged ' ] #目标变量tdata=dummies data [ ' college plans ' ] #如何部署决策树froms klearn.treeimportdecect 8表示叶最下端的叶数dt model=decisiontreeclassifier (max _ leaf _ nodes=8),引入10折交叉验证方法。 模型的最终分数froms klearn.model _ selectionimportcross _ val _ score cross _ val _ score (dt model、fData、tData, 得到cv=10 ) tData ) froms klearn.treeimportexport _ graphviz )需要绘制的dot文件withopen (d :\ datapy case _ nu n w ' ) ASF : f=export _ graphviz (dt model, out_file=f )在cmd客户端上绘制dote命令,然后在dot文件路径# dot-t png data.dot-oloan _ tree.png # png # dot-tpd fdata.dood 切换到的pypdot执行和绘制importpydotfromsklearn.externals.siximportstringiodot _ data=stringio (export _ graphviz ) dtmodel feature_names=[ '父母的收入','智商','性别=男人','父母鼓励=不鼓励' ],filled=True, round eer special _ characters=true (将# dot _ data转换为图形变量graph=py dot.graph _ from _ dot _ data ) _ dot _ data.getvta

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。