皮尔逊相关系数计算过程备忘。
首先记录下3个公式:
1、皮尔逊相关系数公式:2、协方差公式:3、标准差公式:s=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n)。x为x1~xn的均值(也叫做期望值E[X])本例中使用维基百科中的例子:例如,有5个国家的国民生产总值分别为 10、20、30、50 、80 亿美元。 假设这5个国家 (顺序相同) 的贫困百分比分别为 11%、12%、13%、15%、18%(使用0.11、0.12、0.13、0.15、0.18) 。皮尔逊相关系数计算过程如下:
1、先计算分子XY变量的协方差,我使用E[XY]-E[X]E[Y]公式进行计算:
10*0.11=1.120*0.12=2.430*0.13=3.950*0.15=7.580*0.18=14.4E[XY]=(1.1 + 2.4 + 3.9 + 7.5 + 14.4) / 5 = 5.86
E[X]=(10+20+30+50+80)/5=38
E[Y]=(0.11+0.12+0.13+0.15+0.18)/5=0.138
计算得出协方差cov(X,Y)结果为5.86-38*0.138=0.616
2、然后计算分母X和Y的标准差
上面已经得出X和Y的均值(期望值E[X],E[Y])分别为38和0.138。
计算X标准差:
(10-38)^2=784(20-38)^2=324(30-38)^2=64(50-38)^2=144(80-38)^2=1764σXsqrt((784 + 324 + 64 + 144 + 1764) / 5) = 24.81935...计算Y标准差:
(0.11-0.138)^2=0.000784(0.12-0.138)^2=0.000324(0.13-0.138)^2=0.000064(0.15-0.138)^2=0.000144(0.18-0.138)^2=0.001764σYsqrt((0.000784 + 0.000324 + 0.000064 + 0.000144 + 0.001764) / 5) = 0.024819...计算得出σXσY结果为24.81935...*0.024819...=0.616
3、最终得到皮尔逊相关系数0.616/0.616=1,XY正相关