首页 > 编程知识 正文

python信度系数分析,python正态分布曲线解读

时间:2023-05-06 15:48:51 阅读:205056 作者:1381

正态分布:

若随机变量x服从有个数学期望为μ,方差为σ2 的正态分布,记为N(μ,σ)

其中期望值决定密度函数的位置,标准差决定分布的幅度,当υ=0,σ=0 时的正态分布是标准正态分布

判断方法有画图/k-s检验

1. Shapiro-Wilk检验(W检验):

样本:小于50

方法:scipy.stats.shapiro(x)

官方文档:SciPy v1.1.0 Reference Guide

参数:x - 待检验数据

返回:W - 统计数;p-value - p值

scipy.stats.shapiro(x)

'''输出结果中第一个为统计量,第二个为P值(统计量越接近1越表明数据和正态分布拟合的好,

P值大于指定的显著性水平,接受原假设,认为样本来自服从正态分布的总体)'''

2.Kolmogorov-Smirnov检验(K-S检验):

样本:大于 300

方法:scipy.stats.kstest (rvs, cdf, args = ( ), N = 20, alternative ='two-sided', mode ='approx')

官方文档:SciPy v0.14.0 Reference Guide

参数:rvs - 待检验数据,可以是字符串、数组;

cdf - 需要设置的检验,这里设置为 norm,也就是正态性检验;

alternative - 设置单双尾检验,默认为 two-sided,还可以设置为单边检验,可以选择 ‘less‘ 或者 ’greater’

返回:W - 统计数;p-value - p值

scipy.stats.kstest(rvs, cdf, args=(), N=20, alternative='two_sided', mode='approx', **kwds)

'''输出结果中第一个为统计量,第二个为P值(注:统计量越接近0就越表明数据和标准正态分布拟合的越好,

如果P值大于显著性水平,通常是0.05,接受原假设,则判断样本的总体服从正态分布)'''

3. Anderson-Darling 检验:

方法:scipy.stats.anderson (x, dist ='norm' )

该方法是由 scipy.stats.kstest 改进而来的,可以做正态分布、指数分布、Logistic 分布、Gumbel 分布等多种分布检验。默认参数为 norm,即正态性检验。

官方文档:SciPy v1.1.0 Reference Guide

参数:x - 待检验数据;dist - 设置需要检验的分布类型

返回:statistic - 统计数;critical_values - 评判值;significance_level - 显著性水平

scipy.stats.anderson (x, dist ='norm' )

4. 正态分布检验:

样本量大于20,小于50, normaltest运用了D’Agostino–Pearson综合测试法,每组样本数大于20

方法:scipy.stats.normaltest (a, axis=0)

该方法专门用来检验数据是否为正态性分布,

官方文档:SciPy v0.14.0 Reference Guide

参数:a - 待检验数据;axis - 可设置为整数或置空,如果设置为 none,则待检验数据被当作单独的数据集来进行检

验。该值默认为 0,即从 0 轴开始逐行进行检验。

返回:k2 - s^2 + k^2,s 为 skewtest 返回的 z-score,k 为 kurtosistest 返回的 z-score,即标准化值;p-value - p值

scipy.stats.normaltest(a, axis=0)

'''输出结果中第一个为统计量,第二个为P值(注:p值大于显著性水平0.05,认为样本数据符合正态分布)'''

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。