首先,我要说明秩相关系数还有其他类型。 例如,kendal秩相关系数。
使用人员线性相关系数有两个限制。
必须假定数据成对地从正态分布中获得。 数据至少在逻辑上是等间隔的。 更常见的情况还有其他几种解决方案,Spearman秩相关系数就是其中之一。 Spearman秩相关系数是一种无参数(与分布无关)的检验方法,用于测量变量之间的联系强度。 如果没有重叠数据,则如果一个变量是另一个变量的严格单调函数,则Spearman秩相关系数为1或-1,变量完全称为Spearman秩相关。 请注意这和Pearson完全相关的区别。 仅当两个变量存在线性关系时,Pearson相关系数为1或-1。
将原始数据xi、yi按照从大到小的顺序排序,将x’I、y’I设为原始数据xi、yi在排序后的列表中的位置。 将x'i,y'i称为xi,yi的等级,等级差di=x'i-y'i。 Spearman秩相关系数如下。
位置原始x排序后秩次原始y排序后秩次差1125465178612546451784610317846103133245144514451445132462053212362416264513-3关于上表中的数据,spearman LAN
如果原始数据中有重复的值,在求等级时以平均值为基准。 例如,以下内容:
原始x秩次调整后的秩次0.8551.24(43 )/2=3.51.23 ) 43 )/2=3.52.3221811
假设验证:
还应该对Spearman秩相关系数进行假设验证,如果n小于等于50,则使用查找表法,如果n大于50,则计算统计量t的值。 也就是说,这是之前皮尔森相关系数假说验证中的t值的计算方式。
针对上述数据,调查等级相关系数检查阈值表
n显著水平0.050.0150.9160.8290.94370.7140.893信度=1-显著水平。 上表中,n=6时,spearman秩相关系数=0.829时,我们认为95%的可靠度下两个随机变量相关,spearman秩相关系数=0.943时,99%的可靠度下两个随机变量相关0.65710.829,即可靠度未达到95%,因此x和y不能被认为相关。
实例: