一直困扰着两列数据的相关性和显现水平问题,出于对excel的留恋,倾向于始终将数据分析放在excel上进行。 本文简要分析excel与SPSS的相关性分析及对显著性水平的检测应用。
(1)方法介绍
Excel中相关系数可以直接调用CORREL或Pearson (如下图所示,可见两者的计算公式相同)
SPSS中相关分析直接使用“分析—相关—二变量”,设置相关系数的计算方法和置信区间。 下图:
的有效水平分析常基于设定的阈值进行判断,即所谓的置信区间,常见的有99%、95%、90%,这意味着该概率为有效水平。 例如,虽然说两列数据相关,但相关系数确实不大; 你说他们没关系。 理由也不充分,所以有必要进行显着的水平分析。 相关系数的显著分析可以通过构建T统计量来实现:
其中,r是相关系数,n是样本量。 如果t的值大于阈值|ta|,则表示设定的置信水平存在正相关; t的值小于-|ta|表示设置的信任级别具有负相关; -|ta|T|ta|时,认为没有关系。
(2)实例分析
Excel: 现有的两列数据x和y,首先,用correl函数建立两组数据的相关系数(correl=0.626748 ); 并构建t统计量; 最后计算99%、95%和90%置信区间水平上的t阈值(用函数跳跃的音调)。 步骤如下。
t统计与阈值比较,,T统计量(5.89)不在T临界值内(-2.44T2.44),简单易懂,得出99%的置信水平下两列数据存在显著正相关。 同样,95%和90%的水平也被分析为有显著相关性(实际上没有必要分析)。 99%有显著相关性,所以在更低的水平上肯定有相关性)。
SPSS:比较简单,直接设置信任区间即可。 如下所述,99%时存在显著相关性。 因为P=0.000,所以远远小于0.01的水平。