皮尔森相关系数怎么做,线性相关的相关系数是什么

皮尔逊相关系数，也称为积差相关系数、积矩相关系数，一般认为在对两组数据首先进行z得分处理后，将两组数据的积和除以样本数z得分，表示正态分布中距数据中心点的距离。等于变量减去平均值除以标准差。在大学线性数学水平上理解，它有点复杂，可以看作是两组数据矢量所成角的馀弦。

根据以上说明，也可以理解关于皮尔森的约束条件：

1、两个变量之间存在线性关系

2、变量为连续变量

3、两个变量总体符合正态分布：取大样本进行正态分布非参数检测

4、两变量独立

在实践统计中，一般只输出两个系数。一个是相关系数，也就是计算出的相关系数的大小，在-1和1之间。另一个是独立的样品检验系数，用于检验样品的一致性。

现在，以计算相关系数的一般步骤为例进行说明。

例9.1测定15名健康成人血液一般凝血酶浓度(单位/毫升)及血液凝血时间)秒)，测定结果记录在表9.1第)2)、)3)栏，询问凝血时间与凝血酶浓度之间是否相关。

1 .绘图，将表9.1的(2)、(3)栏中各对的数据绘制在散点图上。

2 .求出x、y、x2、y2、xy。见表9.1下。

3 )代入公式，求出r值。

表9.1相关系数计算表

被试验者号码

(1) ) ) )。

凝血酶浓度(单位/毫升) x

(2) ) ) )。

凝血时间(秒) y

(3) ) )。

1.1

1.2

1.0

0.9

1.2

1.1

0.9

1.0

0.9

1.1

0.9

1.1

1.0

0.8

共计

15.1

222

∑X=15.1　∑Y=222

∑XY=221.7　
　∑X2=15.41∑Y2=3304　　　　

　　本例的相关系数r=-0.9070，负值表示血凝时间随凝血酶浓度的增高而缩短；绝对值∣-0.9070∣表示这一关系的密切程度。至于此相关系数是否显著，则要经过下面的分析。

　　（二）相关系数的假设检验

　　虽然样本相关系数r可作为总体相关系数ρ的估计值，但从相关系数ρ=0的总体中抽出的样本，计算其相关系数r，因为有抽样误差，故不一定是0，要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体，必须进行显著性检验。检验假设是ρ=0，r与0的差别是否显著要按该样本来自ρ=0的总体概率而定。如果从相关系数ρ=0的总体中取得某r值的概率P>0.05，我们就接受假设，认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系；如果取得r值的概率P≤0.05或P≤0.01，我们就在α=0.05或α=0.01水准上拒绝检验假设，认为该r值不是来自ρ=0的总体，而是来自ρ≠0的另一个总体，因此就判断两变量间有显著关系。

　　由于来自ρ-0的总体的所有样本相关系数呈对称分布，故r的显著性可用t检验来进行。本例r=-0.9070，进行t检验的步骤为：

　　1．建立检验假设，H0：ρ=0，H1：ρ≠0，α=0.01

　　2．计算相关系数的r的t值：

　　（9.3）

　　3．查t值表作结论

　　ν=n-2=15-2=13

　　根据专业知识知道凝血酶浓度与凝血时间之间不会呈正相关，故宜用单侧界限，查t值表得

　　t0.01,13=2.650

　　今∣tr∣>t0.01,13，P<0.01，在α=0.01水准上拒绝H0，接受H1，故可认为凝血时间的长短与血液中酶浓度有负相关。

　　为简化tr检验的计算过程，数理统计工作者根据t分配表，已把不同自由度时r的临界值求出，并列成相关系数界值表（见附表11）。故求相关系数后，只需查表就可知道该r值是否显著，而不必再计算tr值。

　　r的显著性界限为

　　|r|<r0.05,　P>0.05　相关不显著

r0.05≤|r|<r0.01,0.05≥P>0.01　在α=0.05水准上相关显著

　　|r|≥r0.01,P≤0.01　在α=0.01水准上相关显著

　　例9.1的ν =15-2=13，查附表11中P（1）的界值，得：

　　r0.05,13=0.441 r0.01,13=0.592

　　现r=-0.9070,∣r∣>r0.01,13,P<0.01,按α=0.01水准，拒绝HO,接受H1。认为ρ≠0，说明凝血时间的长短与血液中凝血酶浓度有负相关。结论与计算所得一致。

　　相关系数的显著性与自由度的大小有关，如n=3,ν=1时，虽r=-0.9070，却为不显著；若ν=400时，即使r=0.1000，亦为显著。因此不能只看r的值，不考虑ν就下结论。