首页 > 编程知识 正文

决策树模型案例实例,决策树分析法例题

时间:2023-05-03 17:21:41 阅读:46789 作者:3

【摘要】将决策树算法应用于产品满意因素分析领域,探讨了决策树算法在客户分析产品满意因素时的应用策略,建立了产品满意因素分析模型,模型结果分析说明了应用策略的合理性。

【关键词】决策树客户分析; 创建模型

随着经济全球化、市场国际化,国内市场环境逐渐趋于合理,竞争越来越激烈。 在制造业领域,以生产为中心、以销售产品为目的的市场战略正在被以顾客为中心、以服务为目的的市场战略所取代。 在新市场战略的指导下,企业相继增加了产品顾客满意因素的分析,实现了生产和销售使顾客更满意的产品、吸引潜在顾客、加强现有顾客、提高产品市场占有率的目标。

针对产品顾客满意因素分析这一预测分类问题,引入决策树算法,探讨决策树算法在产品顾客满意因素分析中的应用策略,建立产品满意因素分析模型,实现决策树在产品顾客满意因素分析中的应用。

一.决策树介绍

决策树是一个按照一系列规则对数据进行分类的过程,它提供了在什么条件下可以得到什么样的值的类似规则的方法。 可以通过倒置的树结构来图像包括根节点、0个或多个内部节点、以及一个或多个叶节点的决策树。 它利用树结构的差异对记录集进行不同的分类,树的每个叶节点表示某个条件下记录集中的子集,根据记录集中的属性差异进行属性划分,进行下级节点,即树的分支,整个过程假设记录集为s,以下是生成暂定决策树的递归算法:

是分区(s )

alltuplesinsareofthesameclass (if ) then return;

/*不需要分类*

foreachvalueofattributeadoevaluatethesplitonthatvalue;

/*评估分裂的算法见下文*

usebestsplitfoundtopartitionsintos1ands 2;

分区(S1; /*递归调用partition () /

分区(S2;

决策树生成过程中,需要根据记录集的属性划分一个根节点或内部节点,如果选择不同的属性,则划分出的记录子集不同,决策树的生长速度和获得的信息规则影响很大。 如何找到最佳分裂,构建下层节点是决策树构建过程中的重要问题。 基尼指数(Gini Index )是一个常用的决策树分裂评估标准,其定义如下:

(1)式中,s为分类的属性关系,有n个元组; 出现在s中的各种相对频率n是s中包含的类的个数。 一个属性关系的基尼指数越小,其分类情况越好。 假设在一定条件下分裂为S1和S2,s、S1和S2的组数分别为n、N1和N2,则该分裂的基尼指数可定义如下

通过使用式(2),能够评价各个分裂的好坏,将最小的设为优选的分裂。

二、决策树在产品满意因素分析中的应用策略

1、属性字段选择

调查客户对产品属性的满意度和需求趋势等相关信息,选择重要的产品属性字段。 针对许多产品属性,选择客户感兴趣的属性字段进行产品客户分析。

当前选定产品的输入属性字段有七个变量:产品重量、产品外形、产品颜色、产品价格、产品配置、产品质量和产品维护。

2、数据采集与数据处理

根据选择的产品属性字段,调查顾客对产品不同属性组合的满意度,询问顾客对新产品属性组合的需求趋势,收集一定量的顾客调查记录。 然后对采集到的有效数据记录进行统一处理、分类工作,直至满足数据建模的要求。

经过处理,得到了表1所示的部分数据。 此产品的属性字段的含义如下:

a .产品重量: 1标识1000kg; 2显示>; 1000kg公斤

b .产品外形: 2表示双门; 4代表4门

c .产品颜色: 1表示红色; 2表示黑色; 3表示其他

d .产品价格: 1标识150,000; (显示)150,000

e .产品配置: 1表示基本,2表示高; 表示高于3; 4表示最高

f .产品质量: 1表示一般; 2表示高

g .产品维护: 1表示定期维护2表示不定期维护

h .产品满意度: 1表示满意度0表示不满意

3、生成决策树模型

采用决策树算法建模是整个产品客户分析中最重要、最核心的阶段。 这个阶段的主要任务是选择合适的输入变量,设置合适的决策树参数建立模型。 常用的决策树训练可以分为两个阶段。 首先,根据最优分裂准则选择某个属性划分训练集,递归调用每个划分中的所有记录直到属于同一个类,建立初步树; 然后,修剪制成的树,去除错误的枝,限制树的深度。

将决策树分裂时1枝的最小样本数设为2,将连续值分支节点的最大分支数设为3,将基尼指数用作决策树分裂评价标准,进行剪枝使决策树的深度为5,就能得到以下的决策树规则和图1所示的决策树地图。

决策树规则:

规则1

:颜色属于[0.99、2.07]时

而且:配置属于[0.99

,1.20)

那么: 满意===> 1

规则2

如果: 颜色属于 [0.99 ,2.07)

并且: 配置属于 [1.20 ,3.20)

并且: 价格属于 [0.99 ,1.07)

那么: 满意===> 0

规则3

如果: 颜色属于 [0.99 ,2.07)

并且: 配置属于 [1.20 ,3.20)

并且: 价格属于 >=1.07

那么: 满意===> 1

规则4

如果: 颜色属于 [0.99 ,2.07)

并且: 配置属于 >=3.20

那么: 满意===> 1

规则5

如果: 颜色属于 >=2.07

并且: 价格属于 [0.99 ,1.10)

那么: 满意===> 1

规则6

如果: 颜色属于 >=2.07

并且: 价格属于 >=1.10

那么: 满意===> 0

分析决策树图和相关规则,我们可以得到产品客户满意因素分析初步结果。根据上述决策树中的规则1,我们可以得到这样的知识:如果产品颜色是红色或者是黑色,并且产品配置是普通配置,那么客户对该产品一般都较为满意,该产品有一定的需求量。再如规则6,如果产品颜色是其他颜色,并且产品价格超过¥150,000,那么客户对该产品一般不是很满意,该产品的需求量也不高。

三、结束语

本文重点探讨了决策树在产品客户分析中的应用策略,并用决策树方法构建了产品满意因素分析预测模型,用于分析预测客户对产品属性的满意程度和需求趋势。本文采用了基尼指数生成决策树的方法,介绍了生成决策树模型的主要步骤。产品客户分析算例证明,该算法分析预测效果好,性能稳定,为产品生产和销售服务等工作提供了重要参考和建议。

【参考文献】

[1] 潘微, 拼搏的中心. 提高客户满意度的决策支持模型[J]. 哈尔滨工业大学学报, 2005,37(4):504-506.

[2] 俭朴的黄豆. 决策树算法研究综述[J]. 电脑知识与技术学术交流, 2006,(1): 155-160.

[3] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[R]. Montery, CA: Wadsworth International Group, 1984.推荐访问:园林

园林

园林

园林

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。