首页 > 编程知识 正文

数据挖掘中分类和聚类的区别是,数据挖掘方法中分类和聚类的含义

时间:2023-05-04 11:39:13 阅读:191294 作者:4346

分类是根绝以往的数据和结果对一部分数据进行结果的预测。有监督学习。
分类预测的基本过程:历史数据是训练数据,要预测的数据称为测试数据,而结果称为类标签。分类预测主要有学习和分类两个阶段:利用数据进行模型参数的调节过程称为训练和学习,训练的结果是产生一个分类器或者分类模型,进而可以根据这个模型对测试数据进行预测,得到相应的类标签结果。类标签的数据种类分为二分类或多酚类。训练数据是有已知的类标签,而且训练数据除类标签外,其余部分的结构和测试数据需要完全一致,即特征数量要对应。分类算法有:决策树、朴素贝叶斯,神经网络,SVM,逻辑回归。

聚类:将本身没有类别的样本聚集称不同的组,这样的一组数据对象的集合称为簇,并且对每一个这样的簇都进行描述的过程。聚类的目的是使属于同一个簇的样本之间彼此相似,而不同簇的样本之间足够不相似。
与分类不同的是:进行聚类前并不知道将要划分的组的个数和类型,没有定义标签或者目标值,聚类归于无监督学习任务。
聚类方法:K-means, k-中心点法。

尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。