首页 > 编程知识 正文

spss一个变量与多个变量相关性分析,如何运用spss分析两个变量是否具有相关性

时间:2023-05-03 07:33:10 阅读:208582 作者:2075

本案例是IBM SPSS数据分析与挖掘实战案例精粹----第七章的学习记录

案例背景或目标:激素水平是否在对照组和实验组之间存在差异

分析方法:Bootstrap抽样,秩和检验,秩变换方法,cox回归

字段包括:性别,年龄,萎缩程度,胃粘膜细胞肠化生程度

基本思路:控制变量法,首先排除性别,年龄,萎缩程度,胃粘膜细胞肠化生程度的影响;

探索性数据分析:观察样本量,样本的分布,是否存在偏态分不等;

样本分布:分析-表

  性别萎缩肠化年龄分组  男女轻度中度重度无轻度中度重度青年组中年组老年组  CountCountCountCountCountCountCountCountCountCountCountCount组别试验组2512141671012132151210对照组20110000000101110

查看激素水平分布:图形--图表构建程序

 

 激素水平呈明显的正偏态分布,必须考虑假设检验方法对数据的分布要求;

采用Bootstrap抽样进行分析:常用经典统计学的分析方法,无一例外的需要对变量的分布进行假定,然后才能进行相应的计算;ootstrap抽样的基本思想是在全部样本未知的情况下,借助部分样本的有放回多次抽样,构建某个估计的置信区间,抽象地说,通过样本得到的估计并没有榨干样本中的信息,bootstrap利用重采样,把剩余价值发挥在构建置信区间上。

bootstrap抽样方法:分析--比较均值--均值--因变量列表(激素水平),自变量列表(组别,性别,年龄),选项--中位数--加入“安详的鸡统计量”,bootstrap子对话框中“执行bootstrap”

 可以观察各个统计量95%区间差异,对某因素的影响进行分析;中位数并不重叠,可能存在统计学差异(初步分析);可以采用采用秩和检验进行更精确的分析:

对因变量变量变换后的建模分析:

常见的变量变换方法:1,对数转换;2,平方根转换;3,平方根正弦转换sin(开方);4:平方转化;5,倒数转换;6,Box-Cox变换;

对于正偏态分布,一般常用的是对数变换:分析----描述统计----P-P图(数据符合指定分布时,P-P图中各点近似呈一条直线。)

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Injisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

上图,总模型p值为0.003,说明整个模型对injisu的预测是有统计学意义的(变量之间相关的),分项来看,只有组别具有统计学意义;

秩变换分析:

当变量转换无法解决问题时,可以使用秩变换:转换----个案排序-----将激素水平放入“变量”列表框;

将字段进行转换后,使用:

1)分析----一般线性模型----单变量

2)将Rjisu选入“因变量”列表框

3)将组别,性别选入“固定因子”列表框,年龄选入“协变量”列表框

4)“模型”子对话框,将组别,性别,年龄的主效应选入“模型”列表框

5)“选项”子对话框,选择“残差图”和“缺乏拟合优度检验”

6)确定。

利用Cox模型进行分析:秩变换分析会损失一些信息,除了非参数方法外,还可以利用生存分析中的COX回归模型进行分析

总结:性别,年龄对激素水平未发现有影响,试验组和对照组之间的激素水平存在明显差异;对于同一个统计问题,可以使用多种模型进行解决,没有正确的模型,只有更加适合的模型;当结论不一样时,应根据模型的特点以及真实情况,判断那种情况更接近真实;也可以使用投票策略进行确定(类似与随机森林,选择多数模型结果)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。