2019独角兽企业重金招聘Python工程师标准>>>
总体的相关系数Cov(X,Y):变量 X和 变量Y 的协方差,公式为 Var(X):变量 X 的方差, Var(X) : Var(Y):变量 Y 的方差,Var(Y)
:变量的 X 的平均值
:变量X 的平均值
样本相关系数
当总体较大时,变量 X 与 Y的全部数值一般不可能去直接观察,从总体中随机抽取一定数量的样本,通过观测值去计算 样本相关系数 r
a、样本相关系数作为总体相关系数的估计值 b、涉及的两个变量 X 和 Y地位是平等的 c、相关系数仅能反映两个变量间的线性相关关系 d、相关系数的取值范围相关系数的取值
a、r 的取值范围:-1 <= r <=1 b、r > 0表现正相关, r < 0表示负相关 c、r = 0表示不存在线性相关关系(并不代表无相关,有可能有其他的相关) d、| r | 表示完全线性相关 e、 0 < | r | < 1表示存在不同程度线性相关 | r | < 0.3 为微弱线性相关 0.3 <= | r | < 0.5 为低度线性相关 0.5 <= | r | < 0.8 为显著线性相关 0.8 <= | r | < 1 为高度线性相关
相关系数的检验
为什么要进行检验 r 相关系数是通过样本数据计算的,因而带有一定的随机性
检验方法
H0 : = 0 相关系数在统计上不显著 H1: ≠ 0
样本统计量:
决策: 若 | t | >= ,表明 r 在统计上是显著的
若 | t | <= ,表明 r 在统计 上是不显著的
转载于:https://my.oschina.net/u/1785519/blog/1511500