首页 > 编程知识 正文

spss聚类分析的简单例题,spss的聚类分析步骤

时间:2023-05-05 22:57:16 阅读:261618 作者:1635

在《详解SPSS两步聚类之参数设置》一文中,我们已经了解了两步聚类的优点、分析原理,以及参数设置的技巧。

在本节中,会对IBM SPSS Statistics聚类后的结果进行解读,其中会涉及到最终聚类的结果、聚类的质量、变量重要性、聚类特征的解读。

如图1所示,我们先来回顾下本例数据在参数设置面板中的详细设置。

图1:二阶聚类设置

一、数值结果

根据上述参数设置,得到如下的数值分析结果。

首先看到自动聚类结果,如图2所示为聚类的透视表结果,展示了不同聚类数目下的BIC、BIC变化量、BIC变化比例与距离测量比率。SPSS会自动综合以上指标的数值,得出最佳的聚类数目。

图2:自动聚类

根据图2的自动聚类透视表结果,SPSS得出了如图3所示的一个3聚类的结果。其中聚类1包含69个个案,占总计34.8%;聚类2包含62个个案,占总计31.3%;聚类3包含67个个案,占总计33.3%。

图3:聚类分布

二、图表结果

接下来,我们再来看看二阶聚类的图表结果。

如图4所示,在模型概要中,显示该模型执行了两步聚类,输入了6个变量,得到3个聚类。另外,其聚类质量为良好。

图4:模型概要

如图5所示,右击模型概要,选择“编辑”选项,打开模型查看器,可进一步查看其它的辅助视图。

图5:编辑图表

如图6所示,在模型查看器的左侧包含了模型概要视图,右侧包含了预测变量重要性视图。而通过单击右侧视图下方的查看选项,可切换聚类大小、聚类特征等视图。

首先看到的是预测变量重要性视图,可以看到,星级是最为重要的变量、其次是销售额与销售量。

图6:预测变量重要性

而从聚类大小看到,3个聚类的占比相似,最大聚类与最小聚类的比值为1.11。

图7:聚类大小

如果想了解不同聚类的特征,可从如图8所示的聚类特征表中得到相关的信息。聚类特征表展示的是聚类与变量的交叉分析,其数值展示的是分类变量的分布或连续变量的中心点,由此可得出不同聚类的显著特征。

比如,聚类2是五星级占比100%,销售额、销售量、客流量中心点最大、所处区域为3(占比38.7%)的店铺类型。

图8:聚类特征表

三、小结

综上所述,SPSS的两步聚类分析解读,可先从BIC准则判断最佳的聚类数目,然后,再从模型概要得到聚类质量。

在确认聚类质量可接受的前提下,可通过模型查看器进一步解读聚类变量的重要性、聚类特征等。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。