数据挖掘中的10种实用分析方法
1 .基于历史的MBR分析
最重要的概念是利用已知的情况预测未来情况的属性,通常是寻找同样的情况进行比较。 有两个因素,分别是距离函数和耦合函数。 距离函数的目的是找出最相似的情况,组合函数组合相似的情况属性,只用于共同预测。
2 .购物篮分析
最重要的目的是找出什么样的东西应该放在一起。 购物车分析的基本运营过程包括以下三点:选择正确的物品,通过共同发生矩阵的讨论挖掘联想规则,克服实际限制。
3 .决策树
解决分类和预测有很强的能力,它表现为规律,这些规律表现为一系列问题,通过不断提问最终可以得出必要的结果。 另外,决策树可能具有二元树、三元树、混合决策树的形态等不同的外形。
4 .遗传算法
建立模式,经过一系列的过程,比如建立新的细胞,使用适当的函数决定后代是否适合这个模式,最后只有最适合的结果才能生存,这个过程一直工作到这个函数收敛到最佳解为止。
5 .聚类分析
其目标是在数据中找到以前不知道的相似的组。
6 .连接分析
基于数学中的图形理论,从记录之间的关系发展了一个模型。 它以关系为主题,从人与人、物与物、或者人与物的关系中发展了相当多的应用。
7.OLAP分析
在线分析在线分析处理
8 .神经网络
通过重复学习的方法,将一系列的例子传递给学习,总结出足以区别的风格。 面对新的实例,神经网络可以根据过去学习的成果进行总结,得出新的结果。
9 .判断分析
当遇到的问题的源变量是定性的、自变量是定量的时,判别分析是一种非常合适的技术,多用于解决分类问题。 变量由两个集团构成时称为双集团判断分析,由多个集团构成时称为多元判别分析。
首先,找出预测变量的线性组合,使组间变异对组内变异的比最大,不想关闭各自的线性组合和以前取得的线性组合。 接着,检验各组的重心是否有差异。 然后找出哪个预测变量具有最大的区分能力。 最后,根据新实验对象的预测变量的数值,将该实验对象分配到某个组。
10 .逻辑回归分析
在判别分析中集团不符合正态分布假设的情况下,物流回归是一个很好的替代方法。