首页 > 编程知识 正文

数据挖掘,数据挖掘分析和数据挖掘

时间:2023-05-05 03:34:44 阅读:212756 作者:4827

什么是数据挖掘

数据挖掘(Data Mining,又译为资料探勘、数据采矿)。它是数据库知识发现(Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。
数据挖掘,一般是指从大量的数据中自动搜索隐藏于其中的特殊关系型的信息的过程。
数据挖掘在技术上的定义是指从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、事先不知道的,但又有潜在有用信息和知识的过程。
数据挖掘是目前人工智能和数据库领域研究的热点问题,主要基于人工智能、集齐学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的整理,从中挖掘出潜在的模式,从而帮助决策者调整市场策略,减少风险,应用领域为情报检索、情报分析、模式识别等。

数据挖掘的一般步骤

数据挖掘的发展阶段

数据挖掘需要的能力

数据挖掘的特点

数据挖掘项目生命周期

数据挖掘系统体系结构

数据挖掘系统由各类数据库、挖掘前处理模块、挖掘操作模块、模式评估模块、知识输出模块组成,这些模块的有机组成构成了数据挖掘系统的体系结构。

数据挖掘的过程模型 FAYYAD

FAYYAD 数据挖掘模型将数据库中的知识看作是一个多阶段的处理过程,它从数据集中识别出以模式来表示的知识,在整个知识发现的过程中包括很多处理步骤,各步骤之间相互影响,反复调整,形成一种螺旋式的上升过程。

FAYYAD 模型是一个偏技术/学术的模型,该模型在实际应用中存在以下两个问题:
① 为什么选择这些数据?
FAYYAD过程模型忽略了具体业务问题的确定,这也是确定选择哪些数据的关键所在。
②模型怎样使用?
数据挖掘是分析型环境中的一门技术,应该在分析型环境中使用。但是,挖掘出的模型需要返回到操作型环境中进行应用,因此,需要构成一个从操作型环境到分析型环境再到操作型环境的封闭的信息流。

SEMMA模型,FAYYAD模型的变种

S(Sample):数据取样
E(Explore):数据探索
M(Modify):数据调整
M(Model):模型搭建
A(Assess):评价

SAS 软件使用的就是该种模型

CRISP-DM

CRISP-DM(Cross-Industy Standard Process for Data Mining,跨行业数据挖掘标准流程)注重数据挖掘技术的应用,解决了FAYYAD 模型存在的两个问题。
CRISP-DM 过程模型从商业的角度给出对数据挖掘方法的理解。目前数据挖掘系统的研制和开发大都遵循CRISP-DM标准,将典型的挖掘和模型的部署紧密结合。

数据挖掘的相关技术简介

一、统计学知识

二、数据挖掘技术

数据挖掘的模型选择思路

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。