首页 > 编程知识 正文

kruskal—wallis检验三线表,ks检验结果分析

时间:2023-05-05 10:44:14 阅读:166711 作者:1669

Kolmogorov-Smirnov是一种频率分布f(x )和理论分布f(x )或两种观测值分布比较的检验方法。 其原始假设H0:两个数据分布一致或数据符合理论分布。 d=max|f(x )-g ) x|,实际观测值DD(n,)拒绝H0,否则接受H0假设。

KS检查与t-检查等其他方法不同,KS检查不需要知道数据的分布,可以说是一种非参数化检查方法。 当然,这种方便的代价是,在检验的数据分布符合特定分布的情况下,KS检验的灵敏度不如相应的检验高。 在样本量较小的情况下,KS检验的最不参数检验在分析两组数据之间是否存在差异时十分常用。

PS:t-检定的假设是检定的数据满足正态分布。 否则,对于小样本不满足正态分布的数据使用t-检验会产生较大的偏差。 对于大样本不满足正态分布的数据,t检验是相当准确有效的手段。

KS检验是如何工作的?

首先在观察下分析数据

对于以下两组数据:

controlb={ 1.26,0.34,0.70,1.75,50.57,1.55,0.08,0.42,0.50,3.20,0.15,0.49,0.95,0.24,1.37,0.17

treatmentb={2.37、2.16、14.82、1.73、41.04、0.23、1.32、2.91、39.41、0.11、27.44、4.51、0.51、4.50、0.18和14

对于controlB,这些数据的统计说明如下:

Mean=3.61

Median=0.60

High=50.6 Low=0.08

标准设备=11.2

可以看出,这组数据不符合正态分布。 否则,约15%的数据小于平均-标准差(3.61-11.2 ),数据中没有明显小于0的数字。

观察数据的累计段函数(Cumulative Fraction Function ) )。

要按从小到大对controlB数据进行排序:

sortedcontrolb={0.08、0.10、0.15、0.17、0.24、0.34、0.38、0.42、0.49、0.70、0.94、0.95、1.26、1.37和1.0 10%的因此,对于任何整数x,累计段小于x的所有整数都占数据集合的百分比。 下图是controlB数据集的累计段图

可以看到大多数数据都在图像的左侧(数据值很小)。 这就是非正态分布的标志。 由于更好的观测数据在x轴上的分布,可以将x轴的坐标等分。在数据都为正的时候有一个很好的方法就是对x轴进行log转换。下图为上图的log转换。

如果对treatmentB的数据制作同样的图表,则可知treatmentB和controlB的数据分布范围大致相同(0.1 - 50 )。 但是,对于大多数x的值,小于x的数据在controlB数据集中所占的比例高于treatmentB,即达到相同累计比例的值在treatment组中高于control。 在KS检定中,将2条累计分布曲线之间的最大垂直差作为d值statistic D使用,记述了两组数据之间的差异。 在此图中,该d值出现在x=1附近,d值为0.45(0.65-0.25 )。

值得注意的是,累计分布曲线的性状是通过对数据进行变换处理而变化的(例如log变换),但d值的大小不变。

百分比图(percentile plot ) )。

estimateddistributionfunctionogive是累计段图表的替代方法。 其优点是可以使用概率图纸作图。 (坐标轴经过特殊的分割处理,y轴上的数值间隔遵循正态分布)。 由此,正态分布的数据在此坐标上呈一条直线,因此可以根据y轴上的概率分布直观地判断数据符合正态分布的程度。

那么这张图是怎么画的呢?

假设有这5个个数-0.45、1.11、-0.48、-0.82、-1.26},将它们按照从小到大的顺序排序,则{ -1.26、-0.82、-0.45、-0.48、-1.26} 0.45是中值,百分比是0.5,但在0.45的累计分布函数中占0.4到0.6的区间。 根据数据集合(n )中的数据x的优先级r,可以根据r/(n-1 )计算x的百分比。 将这些数据与他们的百分比进行配对,得到{ (-1.26, 167,-0.82, 333,-0.45,5),0.48, 667,1.11, 833。 然后用直线连接各点的就是百分比图。 用下图的红线表示。 另一条线是累计的段曲线。

treatmentB数据近似对数正态分布,其几何平均为2.563,标准差为6.795。 该数据的百分表(红色)和与其近似的对数正态分布曲线(蓝色)如下所示:

由于数据接近正态分布,采用T检验是最佳检验方法。

如何使用KS检验

r可以是ks.test (函数。

与类似的分布检验方式比较

常用的符合性和Kolmogorov-Smirnov检测效果较差,许多计算机软件中的Kolmogorov-Smirnov检测无论大小样本都是大样本近似公式,不准确,一般为sholmogorov-Smirnov检测Kolmogorov-Smirnov检测只能检测一个样品是否来自已知样品,而Lilliefor检测可以检测是否来自未知总体。 Shapiro-Wilk和Lilliefor检查是通过对大小进行排序而获得的,因此容易受到异常值的影响。 Shapiro-Wilk检测仅适用于小样本(3n50 ),其他方法的检测效果一般随样本容量的增大而增大。 符合性检测和Kolmogorov-Smirnov检测均采用实际度数和期望度数进行检测。 前者可用于连续总体和离散总体,但Kolmogorov-Smirnov检验仅适用于连续和定量数据。 符合性检验的检验结果取决于组,其他方法的检验结果与区间划分无关。参考链接:

33558 www.physics.csb sju.edu/stats/ks-test.html

3358 blog.Sina.com.cn/s/blog _ 403 aa80 a 01019 ly5.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。