首页 > 编程知识 正文

聚类算法和分类算法,聚类方法的种类

时间:2023-05-04 05:46:30 阅读:51339 作者:2309

聚类与分类算法的区别

不同学习方式的聚类是非监督式学习算法,分类为监督式学习算法。

对源数据集的要求不同,有无目标值

适用场景不同

聚类一般应用于数据可搜索性分析、数据降维、数据压缩等可搜索性、过程性分析和处理

分类多用于预测分析和使用。

解读结果不同。 聚类算法的结果是将不同的数据集根据各自的典型特征分为不同的类别,聚类结果的解读可能因人而异; 分类的结果是固定值(例如,高、中、低、是、否等),不存在不同的解读。

模型评价指标不同

聚类中没有所谓“准确”或多准确的相关度量,而是基于距离的度量很多。 在对带标签数据集进行聚类的情况下,能够评价类似度、完整性等

分类模型的指标如准确率、混淆矩阵、提高率等有明显的好指标和差指标、提高程度等评价指标。 例如,准确率、混淆矩阵、提高率等有明显的好与坏、提高程度等评价指标。

如果原始数据集具有类别标签,则可以选择分类或群集算法(不一定要使用标签列数据)。 如果原始数据集没有类别标签,则只能选择使用群集算法。

关于分类和聚类的应用实例

现在公司要对某个新人员进行宣传活动。 例如,推荐商品、提供个性化信息、推荐最感兴趣的热点列表等,尽可能提供该用户感兴趣的内容。

分类:根据现有会员及其特定类别标签(可以选择与代表性或实际运营场景最相关的类别标签)进行分类模型训练,将该新用户的数据作为新样本输入模型中,然后将该用户所属的目标类别然后,在该类别中计算用户最频繁购买的商品、频繁浏览的信息等,并提示推荐内容。

集群:将新会员和现有会员作为一体进行集群分析,获得该会员所属的集群类别,进而提取该类别下其他会员的频繁购买商品、频繁浏览信息等,并提示推荐内容。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。