总体方差和样本方差
在概率论中,方差用来衡量随机变量和数学期望之间的偏离程度。例如已知的随机变量x。而它的期望值:
那么它的方差就是:
对于很多场景来说,其种群方差很难获得,比如一些场合的破坏性测试。因此,在实际应用中,抽样方法一般用于用样本均值和方差估计总体的均值和方差。
总体方差是一个确定的值,样本方差是一个随机变量。
无偏估计
例如,如果我们想知道目前地球上人类的平均寿命,没有办法对所有国家和种族的寿命进行统计研究,只能选择一些样本来估计全球人类的平均寿命。例如,我们对人类寿命进行了如下采样:
那么:
如果来自不同样本的x在附近波动,则称为的无偏估计。
就像投篮一样,只要打在靶心周围,就是好结果,没有偏见。
更严格的定义:
样本方差是总体方差的无偏估计。
为什么样本方差是无偏估计
预计方差和秒矩之间有以下重要的恒等式:
根据下面的定义,证明了样本方差是总体方差:的无偏估计。