首页 > 编程知识 正文

数据挖掘十大算法pdf(数据挖掘技术)

时间:2023-05-04 09:53:07 阅读:89254 作者:3501

数据挖掘中的10种实用分析方法

1 .基于历史的MBR分析

最重要的概念是利用已知的情况预测未来情况的属性,通常是寻找同样的情况进行比较。 有两个因素,分别是距离函数和耦合函数。 距离函数的目的是找出最相似的情况,组合函数组合相似的情况属性,只用于共同预测。

2 .购物篮分析

最重要的目的是找出什么样的东西应该放在一起。 购物车分析的基本运营过程包括以下三点:选择正确的物品,通过共同发生矩阵的讨论挖掘联想规则,克服实际限制。

3 .决策树

解决分类和预测有很强的能力,它表现为规律,这些规律表现为一系列问题,通过不断提问最终可以得出必要的结果。 另外,决策树可能具有二元树、三元树、混合决策树的形态等不同的外形。

4 .遗传算法

建立模式,经过一系列的过程,比如建立新的细胞,使用适当的函数决定后代是否适合这个模式,最后只有最适合的结果才能生存,这个过程一直工作到这个函数收敛到最佳解为止。

5 .聚类分析

其目标是在数据中找到以前不知道的相似的组。

6 .连接分析

基于数学中的图形理论,从记录之间的关系发展了一个模型。 它以关系为主题,从人与人、物与物、或者人与物的关系中发展了相当多的应用。

7.OLAP分析

在线分析在线分析处理

8 .神经网络

通过重复学习的方法,将一系列的例子传递给学习,总结出足以区别的风格。 面对新的实例,神经网络可以根据过去学习的成果进行总结,得出新的结果。

9 .判断分析

当遇到的问题的源变量是定性的、自变量是定量的时,判别分析是一种非常合适的技术,多用于解决分类问题。 变量由两个集团构成时称为双集团判断分析,由多个集团构成时称为多元判别分析。

首先,找出预测变量的线性组合,使组间变异对组内变异的比最大,不想关闭各自的线性组合和以前取得的线性组合。 接着,检验各组的重心是否有差异。 然后找出哪个预测变量具有最大的区分能力。 最后,根据新实验对象的预测变量的数值,将该实验对象分配到某个组。

10 .逻辑回归分析

在判别分析中集团不符合正态分布假设的情况下,物流回归是一个很好的替代方法。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。