首页 > 编程知识 正文

dunnett检验结果分析,卡方检验和假设检验的区别

时间:2023-05-05 00:11:20 阅读:166708 作者:4415

1. KS检验Kolmogorov-Smirnov检验基于累计分布函数,用于检验一个分布是否符合某个理论分布,或比较两个经验分布是否存在显著差异。

单样本K-S检验用于检验一个数据的观测经验分布是否符合已知的理论分布。

由于两样本的K-S检验对两样本经验分布函数的位置和形状参数的差异很敏感,因此成为比较两样本最有用、最常用的非参数方法之一。

其中,fn(x )是观察序列值,fn(x )是理论序列值或其他观察序列值

1.1步骤

)1)提出假设H0:fn(x )=f (x ) )

)2)计算样本累计频率与理论分布累计概率的绝对差,最大绝对差为Dn; dn=max{[fn(x )-f(x ) ]}

)3)在样本容量n和显著水平a下检测阈值Dna;

)4)在DnDna的情况下,认为拟合是令人满意的。

1.2例

单样品KS检测

双样本KS检测

2. t检验t检验,又称student t检验,是一种主要用户样本含量少,总体标准差未知的正态分布。

t检验是利用t分布理论推论差异发生的概率,比较两个平均的差异是否显著。

T检验分为单总体检验和双总体检验。

单总体t检验是验证样本平均值与已知整体平均值之间的差异是否显著。 当总体分布为正态分布时,例如总体标准差不明显且样本容量小于30时,样本均值和总体均值的方差统计量呈现t分布。 单个总体的t检验统计量为样本平均数,样本标准差,其中n为样本数目。 该统计量t在=0为真的零假设下遵循自由度n-1的t分布。 2.1步骤

(1)提出假说,确定假说水准

)2)检验统计量t的计算

)3)查阅相应阈值表,确定p值,并下结论;

3. f检验T检验和F检验的由来:为了确定从样本中的统计结果推论整体时跛行的概率。

f检验又称为联合假设检验,又称方差比率检验、方差均匀性检验。 是英国统计学家Fisher提出的。

通过比较两组数据的方差,判断精度是否存在显著差异。

计算步骤:

样本标准偏差的平方,即s*s=(x-) )2/(n-1 )两组数据可以将获得两个S 2值f=s’2/s’2计算的f值与通过查找表获得的f表值进行比较ff表显示两组数据有明显差异。 4. Grubbs检验4.1概要在一组测量数据中,如有个别数据偏离平均值,此数据称为“可疑值”。 根据格拉布斯法判断,可以从测量数据中排除“可疑值”。

4.2步骤(1)计算平均值和标准差;

)2)计算“可疑值”的g值:

gi=(Xi-) /,其中I是可疑值编号。

)3)当决定了检测电平时,可靠概率p=1-(越小越严格); 根据p值和测定次数nsldxtz表得到阈值gp(n );

)4)将Gi与阈值进行比较,如果是gigp(n ),则判断为异常;

4.3迪克森检验用于一组测量数据一致性检验和提出异常值的检验,适用于检测一个或多个异常值。

如果最大值和最小值同时为可疑值,或者最大值和最小值在同一侧同时存在两个可疑值,则此方法不可取。

检测方法如下。

将n次测量的数据按照从小到大的顺序排列为x1、x2、xn-1、xn。 x1是最小可疑值,xn是最大可疑值,根据以下适当的公式计算统计量r :

根据n次测定和显著性水平表调查的阈值,如果统计量r大于阈值,则判断为异常,可以排除。 重复检测,直到知道不再检测到其他异常值为止。

5 .卡方检验卡方检验是指统计样本实际观测值与理论估计值的偏离程度,实际观测值与理论估计值的偏离程度决定卡方值的大小,卡方值越大则表示不一致; 卡方值越小偏差越小,趋于一致,如果两个值完全相等,则卡方值为0,表示理论值完全一致。

5.1步骤(1)原假设H0 )提出总体x的分布函数f(x );

)2)将整体x的可取范围划分为互不相交的k个小区间A1-Ak;

)3)将落在第I个区间Ai中的样本的数量作为fi,作为组频率。 f1 f2 f3 . fk=n;

)4)如果H0为真,则可以根据假设总体的理论分布计算总体x的值落入第I个小区间Ai的概率pi。 于是,n*pi为落在第I个小区间Ai中的样本值的理论度数。

5 )如果H0为真,则其在第n次尝试中样本落入第I个小区间Ai的频率fi/n应该接近概率pi。 基于这样的想法,皮尔森引入了检验统计量

、H0假设成立时,遵循自由度为k-1的卡方分布。

5.2检验方法独立样品四格表

自由度为1(k=2),自由度=(行数- 1) * (列数- 1) )

假设两个分类变量x和y

,值域分别为(x1, x2)和(y1, y2),其样本频数列联表为:

  y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d
        对V = 1,卡方分布的临界概率是:

      

x2值描述了自变量与因变量之间的相关程度:x2值越大,相关程度也越大,所以很自然的可以利用x2值来做降维,保留相关程度大的变量。

6. 对比6.1 KS检验与卡方检验

相同点:都采用实际频数和期望频数只差进行检验

不同点:①卡方检验主要用于类别数据,而KS检验主要用于有计量单位的连续和定量数据。

              ②卡方检验也可以用于定量数据,但必须先将数据分组才能获得实际的观测频数,而KS检验能直接对原始数据进行检验,所以它对数据的利用比较完整。

6.2 KS检验的优势与劣势作为一种非参数方法,具有稳健性不依赖均值的位置对尺度化不敏感适用范围广(t检验仅局限于正态分布,当数据偏离正态分布太多时,t检验会失效)比卡方更有效如果数据缺失服从正态分布,则没有t检验敏感(有效)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。