【摘要】将决策树算法应用于产品满意因素分析领域,探讨了决策树算法在客户分析产品满意因素时的应用策略,建立了产品满意因素分析模型,模型结果分析说明了应用策略的合理性。
【关键词】决策树客户分析; 创建模型
随着经济全球化、市场国际化,国内市场环境逐渐趋于合理,竞争越来越激烈。 在制造业领域,以生产为中心、以销售产品为目的的市场战略正在被以顾客为中心、以服务为目的的市场战略所取代。 在新市场战略的指导下,企业相继增加了产品顾客满意因素的分析,实现了生产和销售使顾客更满意的产品、吸引潜在顾客、加强现有顾客、提高产品市场占有率的目标。
针对产品顾客满意因素分析这一预测分类问题,引入决策树算法,探讨决策树算法在产品顾客满意因素分析中的应用策略,建立产品满意因素分析模型,实现决策树在产品顾客满意因素分析中的应用。
一.决策树介绍
决策树是一个按照一系列规则对数据进行分类的过程,它提供了在什么条件下可以得到什么样的值的类似规则的方法。 可以通过倒置的树结构来图像包括根节点、0个或多个内部节点、以及一个或多个叶节点的决策树。 它利用树结构的差异对记录集进行不同的分类,树的每个叶节点表示某个条件下记录集中的子集,根据记录集中的属性差异进行属性划分,进行下级节点,即树的分支,整个过程假设记录集为s,以下是生成暂定决策树的递归算法:
是分区(s )
alltuplesinsareofthesameclass (if ) then return;
/*不需要分类*
foreachvalueofattributeadoevaluatethesplitonthatvalue;
/*评估分裂的算法见下文*
usebestsplitfoundtopartitionsintos1ands 2;
分区(S1; /*递归调用partition () /
分区(S2;
决策树生成过程中,需要根据记录集的属性划分一个根节点或内部节点,如果选择不同的属性,则划分出的记录子集不同,决策树的生长速度和获得的信息规则影响很大。 如何找到最佳分裂,构建下层节点是决策树构建过程中的重要问题。 基尼指数(Gini Index )是一个常用的决策树分裂评估标准,其定义如下:
(1)式中,s为分类的属性关系,有n个元组; 出现在s中的各种相对频率n是s中包含的类的个数。 一个属性关系的基尼指数越小,其分类情况越好。 假设在一定条件下分裂为S1和S2,s、S1和S2的组数分别为n、N1和N2,则该分裂的基尼指数可定义如下
通过使用式(2),能够评价各个分裂的好坏,将最小的设为优选的分裂。
二、决策树在产品满意因素分析中的应用策略
1、属性字段选择
调查客户对产品属性的满意度和需求趋势等相关信息,选择重要的产品属性字段。 针对许多产品属性,选择客户感兴趣的属性字段进行产品客户分析。
当前选定产品的输入属性字段有七个变量:产品重量、产品外形、产品颜色、产品价格、产品配置、产品质量和产品维护。
2、数据采集与数据处理
根据选择的产品属性字段,调查顾客对产品不同属性组合的满意度,询问顾客对新产品属性组合的需求趋势,收集一定量的顾客调查记录。 然后对采集到的有效数据记录进行统一处理、分类工作,直至满足数据建模的要求。
经过处理,得到了表1所示的部分数据。 此产品的属性字段的含义如下:
a .产品重量: 1标识1000kg; 2显示>; 1000kg公斤
b .产品外形: 2表示双门; 4代表4门
c .产品颜色: 1表示红色; 2表示黑色; 3表示其他
d .产品价格: 1标识150,000; (显示)150,000
e .产品配置: 1表示基本,2表示高; 表示高于3; 4表示最高
f .产品质量: 1表示一般; 2表示高
g .产品维护: 1表示定期维护2表示不定期维护
h .产品满意度: 1表示满意度0表示不满意
3、生成决策树模型
采用决策树算法建模是整个产品客户分析中最重要、最核心的阶段。 这个阶段的主要任务是选择合适的输入变量,设置合适的决策树参数建立模型。 常用的决策树训练可以分为两个阶段。 首先,根据最优分裂准则选择某个属性划分训练集,递归调用每个划分中的所有记录直到属于同一个类,建立初步树; 然后,修剪制成的树,去除错误的枝,限制树的深度。
将决策树分裂时1枝的最小样本数设为2,将连续值分支节点的最大分支数设为3,将基尼指数用作决策树分裂评价标准,进行剪枝使决策树的深度为5,就能得到以下的决策树规则和图1所示的决策树地图。
决策树规则:
规则1
:颜色属于[0.99、2.07]时
而且:配置属于[0.99
,1.20)那么: 满意===> 1
规则2
如果: 颜色属于 [0.99 ,2.07)
并且: 配置属于 [1.20 ,3.20)
并且: 价格属于 [0.99 ,1.07)
那么: 满意===> 0
规则3
如果: 颜色属于 [0.99 ,2.07)
并且: 配置属于 [1.20 ,3.20)
并且: 价格属于 >=1.07
那么: 满意===> 1
规则4
如果: 颜色属于 [0.99 ,2.07)
并且: 配置属于 >=3.20
那么: 满意===> 1
规则5
如果: 颜色属于 >=2.07
并且: 价格属于 [0.99 ,1.10)
那么: 满意===> 1
规则6
如果: 颜色属于 >=2.07
并且: 价格属于 >=1.10
那么: 满意===> 0
分析决策树图和相关规则,我们可以得到产品客户满意因素分析初步结果。根据上述决策树中的规则1,我们可以得到这样的知识:如果产品颜色是红色或者是黑色,并且产品配置是普通配置,那么客户对该产品一般都较为满意,该产品有一定的需求量。再如规则6,如果产品颜色是其他颜色,并且产品价格超过¥150,000,那么客户对该产品一般不是很满意,该产品的需求量也不高。
三、结束语
本文重点探讨了决策树在产品客户分析中的应用策略,并用决策树方法构建了产品满意因素分析预测模型,用于分析预测客户对产品属性的满意程度和需求趋势。本文采用了基尼指数生成决策树的方法,介绍了生成决策树模型的主要步骤。产品客户分析算例证明,该算法分析预测效果好,性能稳定,为产品生产和销售服务等工作提供了重要参考和建议。
【参考文献】
[1] 潘微, 拼搏的中心. 提高客户满意度的决策支持模型[J]. 哈尔滨工业大学学报, 2005,37(4):504-506.
[2] 俭朴的黄豆. 决策树算法研究综述[J]. 电脑知识与技术学术交流, 2006,(1): 155-160.
[3] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[R]. Montery, CA: Wadsworth International Group, 1984.推荐访问:园林
园林
园林
园林