首页 > 编程知识 正文

k均值聚类分析结果(聚类分析例题)

时间:2023-05-03 09:14:43 阅读:78219 作者:27

序曲

清平乐雪

【宋】洁白的约定

从容应对,显得轻松。 半夜在萧萧的窗外发出声音,多在梅旁的竹子上。

朱楼kkdnp窗帘拉开,六花纷纷飞来。 没办法,只能用熏制的烟举起金钉。

【译文】

fzdjr翩翩飞舞,身姿轻盈而聪明。 半夜窗外下了大雪的小型迷你裙发出声响,只折断了那个院子里的梅树和竹枝。 第二天起床就迫不及待地拉开窗帘,fzdjr从那边跳了进来。 无奈室内熏炉里的烟很快就把身上的fzdjr全部融化了,只能看着fzdjr化作热气腾腾的雾升起,裹在她轻轻地扎了金钉的脑袋里。

【观赏】

雪,自古以来就受到人们的喜爱。 东晋谢家才女说“未若柳絮随风”,似乎成为后世文人反复咏唱的对象。

“悠哉地炸,打扮得很轻。 ”黄昏时,作者看到了fzdjr在空中飞舞。 形容为“轻妙的姿态”、轻妙的姿态,正是传神的语言。 500多年后,他在一个甜美的秋天写下了“《采桑子》”这个词,一开始就用了“非关癖喜欢轻佻的样子,喜欢寒冷的地方”这样敏感的花瓣语言。 dpdzs表明了自己的看法,我不喜欢fzdjr轻盈悠扬的样子,我之所以喜欢它,是因为它有着人类绝无仅有的孤独冷漠的美。

“无奈熏蒸炉的烟雾会抬起金钉。 ”结语笔触轻盈,感情细腻。 作者回到房间时,没想到房间熏制炉里有温度的烟,会让身体里的fzdjr很快溶解。 她无奈地看着fzdjr化作热气腾腾的雾升上去,轻轻地被金钉扎进了脑袋。 雾不久就消失了,她看起来无比失落,只能一个人在那低眉叹息。

明末理论家沈际飞评价这句话“雪形声,满耳”。 借词抒情,不写一字喜怒。 作者用轻盈的笔触,这样细致地描写了一个女人一喜一忧的表情,但却很精彩。

人的一生中,许多美好的东西注定要瞬间消失。 也说内向的毛皮虾教授,纤细美丽的景色,能反映出女性语言内心敏感纤细的感情。

注:来源于古诗网

系统聚类分析简介

聚类方法有多种,除了上述两种均值聚类、两步聚类方法外,还有系统聚类,也是实际工作中常用的方法。 这可以应用于小样本变量聚类或样本聚类,并且原始数据可以是数字变量或者多分类变量。 但是,请避免混合不同类型的变量。 三个变量可以选择不同的距离测量值。

系统聚类的具体步骤如下。

最初每个样本/变量视为一种,假设为n种; 计算上述n个类别的两个类别间距离,将距离最小的两个类别合并为一个。 此时,共享n-1类来计算上述n-1类的两个类间距离,将距离最小的两个类合并为一个。 在这一点上,整个聚类过程可以被创建为聚类地图,从而共享n-2类,根据类间距离和实际意义选择适当的分类,直到所有类都聚集在一起。 类和类之间的距离有多种定义方法,定义不同会生成不同的算法,不同的算法、不同的算法可能会得到不同的结果。 什么样的结果合适,需要结合专业知识来判断。

SPSS实现系统聚类

例:某研究室拟通过气相色谱法分析细菌全细胞脂肪酸含量研究细菌分类与鉴定。 受试菌株共24株,其中空肠弯曲菌8株(符号CJ1-CJ8 )、结肠弯曲菌3株(符号CC1-CC3 )、幽门螺杆菌9株)和其他肠道杆菌4株(符号XX1-XX4 )。 用气象色谱法测定各菌株12种脂肪酸的含有率(变量名X1-X12 )。 要求根据变量X1-X12对24个各菌株进行聚类分析。 具体数据如下。

1 .打开分析-分类-辅助聚类

-caption">

2. 参数选择与说明

(1)主页面

变量:选择用于聚类的变量个案标注依据:选择标签变量,在结果中表示观测记录聚类:指定聚类分析的类型

----个案:进行对样本聚类,即Q型聚类

----变量:对变量的聚类,即R型聚类

显示:指定聚类分析输出哪些内容

----统计:输出距离矩阵、最终分类信息等

----图形:反映聚类过程的树形图、冰状图等

(2)统计 页面

集中计划:输出聚类过程表,包括每一步被合并的类或样本测量以及它们之间的距离和新生成的类等消息。根据此表能追踪整个聚类的合并过程,由于每次都是把最相近的两类聚为一类,据此可查看哪些观测量之间的距离最近。近似值矩阵:输出各项之间的距离矩阵或相似度矩阵,产生什么类型的矩阵取决于在 方法 选项卡中测量栏的选择聚类成员:设置类成员表的输出格式,包括每个观测记录的最终分类结果

----无:不显示类成员表,默认选项

----单个解:输出指定聚类个数时的类成员表,在右侧的输入框指定聚类个数,该数值必须大于1,且小于等于参与聚类的样本个数和变量个数。

----解的范围:输出聚类个数在某个范围时的类成员表,在 最小聚类数 框中指定一个最小的聚类个数,在最大聚类数 框中指定一个最大的聚类个数。

(3)图 页面

谱系图:输出树形图,系统地描绘了聚类的整个过程冰柱图:

a.全部聚类:表示把聚类的每一步都表现在图中,如此可查看聚类的全过程;

b.指定范围内的聚类:指定显示的聚类个数范围。开始聚类—显示起始聚类步数;停止聚类—显示终止聚类步数;依据—指定要连续显示的两步聚类步骤之间的步数增量

方向:设定冰柱图的显示方向

(4)方法 页面

聚类方法:选择计算类间距离的方法

a.组间联接:类间平均法,倾向合并偏差较小的类

b.组内联接:类内平均法,倾向合并偏差较小的类

c.最近邻元素:适用于非常离散的资料

d.最远邻元素:受异常值影响大,适合高度压缩的资料

e.质心聚类:中间距离法,为前两种方法的折中

f.中位数聚类:中心法,分类效果较差,但稳健,对异常值不敏感

lkddp法:离差平方和法,倾向得到各类样本数目接近的分类结果,分类效果好但对异常值敏感

测量:对不同类型的变量选择不同的距离度量方法;区间—数值变量,默认;计数—分类变量;二元—二分类变量。转换值:选择数据标准化的方法转换测量:选择对距离测度再变换的方法;包括取绝对值、改变符号、重新标度0-1的范围。

(5)保存 页面:创建新变量,保存聚类结果

单个解:设定某一聚类数时的聚类结果解的范围:设定某一聚类范围时的聚类结果

3.结果输出与解释

(1)个案处理摘要

显示样本数、缺失值数,及所占百分比。

(2)聚类过程详细步骤

可以看到:

第一步:13号和16号样本先聚为一类;第二步:13/16/19号样本聚为一类;直到最后全部样本聚为一类。

(3)聚类图

样本聚为2类或3类;两类结果中,除HP9独成一类,其余为一类;三类结果中,HP9独成一类,XX1-XX4为一类,剩余样本聚为一类。

4.语法

*******************系统聚类 ******************. PROXIMITIES x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 /MATRIX OUT(D0.03150135853290548) /VIEW=CASE /MEASURE=SEUCLID /PRINT NONE /ID=name /STANDARDIZE=VARIABLE Z.

5.总结

聚类分析属于探索性分析工具,对聚类分析结果的优劣评价目前还没有系统的检验理论,因此实际工作中,只能通过多次尝试,结合实际意义选取较优的分类结果3种聚类方法结果如下:

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。