首页 > 编程知识 正文

SPSS十三SPSS之多重对应分析文 数据集,ols分析数据对应问题

时间:2023-05-05 03:53:11 阅读:277011 作者:3669

SPSS(十三)SPSS之多重对应分析(图文+数据集)

前一篇SPSS(十二)SPSS对应分析(图文+数据集)讲的只是针对两个变量的,我们看其对话框,行列都只是能放一个变量而已,对应的是简单的对应分析,对应操作如下

 

 但是假如我们研究多个变量呢?不止是两个分类变量之间的关联呢??通过最优尺度分析来解决多组分类变量之间的关联分析。

最优尺度变换 最优尺度变换诞生背景

许多时候我们所分析的变量并非连续性变量,如评分、等级等如果要按照连续变量来分析,则存在一个适当量化的问题;有时候虽然变量均为连续性,但变量间的关系并非简单的线性,而现有的多元分析方法几乎无一例外的是以线性关联为基础进行分析的;多个变量间的复杂联系如何能够简单明了的表现出来?

所谓最优尺度变换的本质,就是根据数据本身的关联,寻找出最佳的原始变量评分方法,将原始变量一律转化为相应的分值,并在转化时将变量间的关联一律变换为线性,这样就解决了以上问题

可以同时分析多个分类变量间的关系,并同样用图形方式表示出来

在变量种类上更加丰富,已可以处理各种类型的变量,如对无序多分类分析、有序多分类变量和连续性变量同时进行分析的问题

最优尺度缺点 不能自动筛选变量,需要用户根据经验和分析结果进行耐心筛选对样本量要求较大,特别是对少数极端值和罕见类别频数的变化非常敏感由于结果往往以图形方式呈现,不加注意可能会得到完全错误地分析结果所作的最优尺度变换是基于数据本身而来,当增减变量、或者对变量进行变换后重新拟合时,相应的结果可能完全不同

 最下边的选定分析里有三种分析方法。也就是最优尺度对应的三种分析方法。

最佳度量水平里有两个选项,所有变量均为多重标称,或某些变量并非多重标称。那么什么叫多重标称呢?多重标称的意思可以理解为就是分类变量。也就是说你的变量都是分类变量的话,那你就选第一个,如果不是的话,那就是选第二个。然后变量集的数目又有两个选项,一个集合,或两个集合。这个意思是在问你你的变量是全都放到一个集合里呢还是分开放到好几分集合里。如果放在一个集合里,那就是对应分析的简单扩展,用来分析多个分类变量的关系。如果是放在多个集合里,那就是用来分析放在不同集合的变量之间的相关性(就是在做集合与集合之间的相关分析)

Homogeneity (HOMALS)

同质性分析,即多重对应分析

以图形化方式展示多个分类变量间的关系

Categorical Principal Components (CatPCA)

其实质为分类变量的主成分分析

当一些变量为名义测量外的其它测量(有序分类或连续性变量)时使用

也就是MR中常用的多维偏好分析

Nonlinear Canonical Correlation (OVERALS)

非线性典型相关方法

用于分析两个或多个变量集之间的关系

允许变量为任何类型

 

案例:轿车特征与一些用户特征的数据之间的联系如何

某次调查得来的轿车特征与一些用户特征的数据,请分析汽车原产地(norigin)、汽车大小(nsize)、轿车类型(ntype)、是否租房(nhome)、有无双份收入(nincome)、性别(nsex)、婚姻状况(nmarit)之间的联系如何

数据集如下

212222121222211312221121222122122212212221221222122122222112221233122133312211331221133122212312212231222113122121312212131221213122121312222131222213122211312222131222113122212212213221221122122112212211221221122122112212222221222222122321212212121221312122121212212121221312122121212212121221312122221212223121222212122313112211311221131122213112221311222131122233112221311222131122213112221211221221122132112212211221321122122112212211221121122112112212211221121122122112213211222321122232112222211222221122212112221211222121122212112222211222121122212112222211222221122212112221211222221122222112221211222321122222112231111221211122111112212111221211122111112212111222111122221112222111222111122221112222222123322212312221231222123212212321221232122123212212321221233122123112212311221232122124222123121212322121231212123121212412121241212124221212431121211112121211212321121232112123211212433311231331124223112421311232131123113112412211232221123222112332211243121123112112321211233121123121112322111233211123121112421111232111124211112422322112232211213221111222112122211212221121222131312211221221111122112112211211221111122111331212123121122312122231212123121211312112131211213121221312121321213122121122212112221211322121122212112221211222121222212123221213222121332212131121211312121131212112121211312121121212112121211212121121212123121212312121221212131311212131121213112121311212221121112112111211211221121112112123211212221121232112122211212121121222112122211212121121212112123211212221121421112112111211311121131112111111211211121121112112111212211121211112122111212211121221112121111212111121221112131332113333211322321132132113213211321321131132113213211321321132132113122211122221131222113222211322221131222113112211121221122122113112211321221132122113212211321221132122113312211313121131312113131211312121111212112221211312121132212113121211322121131212113121211321121132112113311211321121132112113211211413311111331113223111112311121231113213111211311123131112213111311311133221113122111312211132221113322111321211122121113212111311211132121113212111321211133121113212111331211132121113212111321211131311111131111213111121311112131111213111122311112131111213111131311113131111322111111211112121111222111123211112121111212111122211112321111212111122211113121111322111132111111211111221111121111112211111221111132111113131222121222121121112213312201

结果解释:
类别点联合图为主要重点,我们在图中得到可能的解释,要回到原始的数据表看是否支持自己的观点(添加X/Y参考线找出原点),分析结果和简单对应分析图解读一致

按案例数加注标签的对象点:表示出每个个体在空间的分布,很难从中得到有价值的信息,一般我们可以存储其坐标,再进行聚类分析,再和个体背景变量关联,做一些预测和关联分析

辨别度量图:可以看出变量在各维度携带的信息量,图中我们看出性别无论在那个维度,携带信息量都很少,如果后续想要简化模型,可以考虑那些变量可以剔除 

多重对应分析注意事项 由于算法不同,当分析两个变量时,结果不会等同于简单对应分析,但是基本相同不推荐同时分析过多变量必要时应当对频数较少的类别加以合并或者剔除得到结果后应当和原始表格加以仔细对照,以确保分析结果的正确性

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。