首页 > 编程知识 正文

轮廓度的计算公式,R语言计算轮廓系数

时间:2023-05-05 18:08:54 阅读:12162 作者:676

轮廓系数:

轮廓系数(Silhouette Coefficient )组合聚类聚集度(Cohesion )和分离度(Separation ),用于评价聚类的效果。 该值介于- 1和1之间,值越大表示群集效果越好。 具体计算方法如下。

对于每个采样点I,计算点I与同一个簇内所有其他元素的距离平均值,标记为a(I ),量化簇内的聚集度。 选择I以外的一个集群b,计算I和b中所有点的平均距离,遍历所有其它集群,找到这个最接近的平均距离,标记为b(I ),是I的邻近集群,并且用于量化集群之间的隔离度。 对于采样点I,轮廓系数s(I )=(b ) I-a (I ) )/max ) I ),b ) I ) }计算所有I的轮廓系数,求平均值后成为当前聚类整体的轮廓系数,测量数据聚类的紧密度为以上或者b ) I )足够大时,即a ) I ) b ) I ),s ) I )接近1,表明聚类效果很好。

转载于:https://www.cn blogs.com/wangle blogs/p/10102492.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。