首页 > 编程知识 正文

轮廓系数为多少说明聚类有效,kmeans聚类分析结果怎么看

时间:2023-05-05 18:24:58 阅读:12122 作者:4880

本文链接至: https://pan.Baidu.com/s/1 rwnvhuxmqleorei 5vi g _ bq

引出导线: p57s

轮廓系数的轮廓系数用于评价一个聚类模型的性能。 良好的聚类:内密而外疏。 同一集群中的样本必须足够密集,不同集群之间的样本必须足够稀疏。

轮廓系数计算规则:计算针对样本空间中的一特定样本的与一集群中的其它样本的平均距离a以及与最接近的其它集群中的所有样本的平均距离b。 该样本的轮廓系数为(b-a )/max(A,b )。 如果对整个样本空间中所有样本的轮廓系数进行算术平均,则该结果可以被用作聚类指标。

这个公式的结果是: [-1,1 ].- 1表示分类效果比较低,1表示分类效果好,0表示聚类重叠,不能很好地对聚类进行分类。

imports klearn.metricsassmscore=sm.silhouette _ score (输入集、输出集、sample_size=采样数、#距离算法: euclidean ttore

' ' demo07_silhouette_score.py配置文件系数' ' ' importnumpyasnpimportsklearn.clusterasscimportmatplotlib.pyplotasmpimpppion 分隔符=', ') # KMeans群集model=sc.kmeans(n_clusters=4) model.fit(x ) x ) centers=model.cluster _ centers _ print pred_y,sample_size=len(x ) x,metric='euclidean ' (打印) score ) # 0).max(1b,t=x (:1 ) . grid_y=NP.meshgrid n ) ) mesh _ x=NP.column _ stack ((grid _ x.ravel )、grid_y.ravel () ) (pred _ memed facecolor='lightgray'(MP.title )、kmeans )、fontsize=16 ) MP.xlabel )、fontsize=14 ) MP.ylabel )、y fontsize grid_y,grid_z,cmap='gray ' () ) ) ) 65 label='points'(#群集的中心点MP.scatter (centers [ :群集] )

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。