首页 > 编程知识 正文

数据挖掘的基本概念是什么,数据挖掘基本概念及功能

时间:2023-05-04 17:31:24 阅读:253632 作者:3733

1、数据挖掘的基本概念

20年前查询不到数据是因为数据太少了;今天查询不到数据是因为数据太多了。

• 数据挖掘又称为数据库中的知识发现。
• 数据挖掘是自动分析企业数据,做出归纳性推理,从中挖掘出潜在模式,帮劣决策者调整市场策略,做出正确决策。

数据挖掘的特征:
• 数据源是真实的、大量的、含有噪声的;
• 发现的是用户感兴趣的知识;
• 发现的知识要可接受、可理解、可运用;
• 不要求发现普及知识,仅要求发现特定知识。

数据挖掘相关技术:
数据融合,人工智能(AI),商务智能(BI),模式识别,机器学习,知识发现,
数据分析,决策支持等。

2、数据挖掘技术

常用数据挖掘技术:
• 分类、回归分析、聚类分析、关联规则、特征分析、偏差分析、Web网页挖掘等。

(1)分类
• 找出数据对象的共同特点;
• 按模式划分为不同的类;
• 将数据顷映射到某个给定的类别。

(2)回归分析
• 反映事务在时间上的特征,収现事务之间的依赖关系。
• 研究问题: 数据序列的趋势特征,数据序列的预测,数据之间的相互关系等。
• 应用:市场营销的各个方面。如,客户寻求,产品生命周期分析,销售趋势预测,针对性促销活劢等。

(3)聚类分析
• 把一组个体按照相似性归成若干类别。
• 目的:使同一类别的数据相似性尽可能大,不同类别中的数据相似性尽可能小。
• 聚类是反映同类事物的共同性质和不同事物的差异性。

(4)关联分析
• 多个变量的叏值之间存在某种规律性称为关联。
• 关联类型: 简单关联,时序关联,因果关联等。
• 目的:找出数据中隐藏的关联网。
• 应用:产品定位,定制客户群,客户细分,营销风险评估,诈骗预测等。

(5)特征分析
• 从一组数据中提取出这些数据的特征。

(6)偏差分析
• 数据常有一些异常记录,不满足规则的特例等。
• 目的:寻找观察结果不参照量之间有意义的差别。

(7)决策树
• 决策树在解决归类与预测问题上有极强的能力。
• 决策树顶端是树根,底部有许多的树叶,它将纪录分解成不同的子集,每个子集中的字段可能包含一个简单的法则。

3、数据挖掘过程

数据挖掘流程:
商业理解,数据准备,模型建立,数据挖掘,结果评估,应用部署。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。