作者|GUEST编译|VK源|Analytics Vidhya
我来介绍一下
检查是统计学中最基本的概念之一。 不仅是数据科学,假设验证在所有领域都很重要。 你想知道怎么办吗? 举个例子吧。 现在有lifebuoy沐浴露。
沐浴露制造商声称杀死了99.9%的细菌。 他们怎么能这么说呢? 需要证明这个说法是正确的测试技术。 所以假说验证被用来证明一个主张或任何假说。
目录假设检验的定义
零和替代假说检验
简单假设检验和复合假设检验
单尾和双尾检查
临界区
类型I和类型II错误。
统计学意义
自信水平
重要度
p的值
该博客将这些概念分解成小部分,以便于了解动机和用途。 gddyx读了这个博客,就会清楚假设验证的基础知识! 呃!
假设验证的定义假设是对参数值(均值、方差、中位数等)的陈述、假设或主张。
假设是关于你周围世界的某件事的有根据的推测。 应该可以通过实验或观察进行测试。
例如,如果你说“yqdxy是有史以来最好的印度队长”,这是一个假设。 我们是基于他担任队长期间球队的平均输赢情况。 我们可以根据所有匹配数据测试这个句子。
验证零假设和替代假设零假设是在假设为真的前提下验证假设是否可能被拒绝。 无罪一般的概念。 我们假设无罪,直到有足够的证据证明嫌疑人有罪。
简单来说,零假说可以看作是已经被接受的陈述。 例如,天空是蓝色的。 我们已经接受了这个声明。
用H0表示。
补充了零假说代替假说。 与原始假设相反,替代假设与原始假设一起涵盖了整体参数的所有可能值。
用H1表示。
让我们用一个例子来理解这一点:
一家肥皂公司声称他们的产品平均杀死了99%的细菌。 为了验证这家公司的主张,提出零和替代假说。
零假设(H0 )平均值为99%
代替假设(H1 ),平均值不是99%。
注意:在验证假设时,在样本有充分证据证明其为假之前,假设原假设为真。 在这种情况下,我们拒绝原假设,支持替代假设。
如果样本不能提供足够的证据拒绝零假设,则零假设不能说是真的,因为它只基于样本数据。 零假说成立需要讨论整体数据。
如果为简单假设验证和复合假设验证假设指定了参数的确切值,则这是一个简单的假设;如果指定了值的范围,则称为复合假设。 例如
一家电动自行车公司声称,一辆车每升的平均行驶距离为100公里。 这是一个简单的假设情况。
某班学生的平均年龄大于20岁。 这是一个复合假设。
如果单尾和双尾假设检验替代假设双向(小于或大于)给出零假设指定的参数值的替代,则称为双尾检验。
如果替代假设仅在一个方向(小于或大于)提供零假设中指定参数值的替代,则称为尾部检查。 例如
(H0 )平均值为100H1 (平均值不一定为100 )根据H1,平均值可以大于或小于100。 这是一个双尾部检查的例子
同样,
H0 :平均值=100H1 :平均值100其中平均值小于100。 这叫片尾检查。
拒绝域拒绝域是样本空间的拒绝域,如果计算值在其中,则拒绝零假设。
让我们用一个例子来理解这一点:
假设你想租一套公寓。 你从不同真实国家的网站上列出了所有可用的公寓。 你的预算是15000卢比/月。 你不能再花那么多钱了。 你订购的公寓列表的价格从7000/月到30000/月不等。
从列表中随机选择公寓,假设以下假设。
H0:我要租这间公寓。
H1:我不租这个公寓。
现在你的预算是1.5万,所以你必须拒绝所有高于这个价格的公寓。
在这里所有的价格都会超过15000成为你的拒绝域。 如果随机公寓的价格在这个区域,你必须拒绝零假设。 如果公寓的价格不在这个区域,你不能拒绝零假设。
根据替代假说,拒绝域位于概率分布曲线的一条或两条尾部。 拒绝域是与概率分布曲线的截断值相对应的预定义区域。 用表示。
阈值是将支持或拒绝零假设的值分离开来,并基于alpha进行计算的。
稍后我们会看到更多的例子,清楚地知道如何选择。
根据另一个假设,拒绝域有三种情况。
案例1(这是双尾部检查。
案例2(这种情况也称为左尾检查。
案例3) )这种情况也称为右尾检查。
类型I和类型II的错误,因此类型1和类型2的错误是假设验证的重要课题之一。 把这个话题分解成更小的部分简化吧。
当一个假正例(I型错误)——gddyx拒绝真正的零假设时。
p>假负性(II型错误)——gddyx接受一个错误的零假设时。犯I型错误(假正例)的概率等于临界区α的显著性水平或大小。
α=P[当H0为真时拒绝H0]
犯II型错误(假阴性)的概率等于β。
β=P[当H1为真时不拒绝H0]
例子:
这个人因犯有入室盗窃罪而被捕。由法官组成的陪审团必须裁定有罪或无罪。
H0:人是无辜的
H1:人有罪
第一类错误是如果陪审团判定某人有罪[拒绝接受H0],尽管此人是无辜的[H0是真的]。
第二类错误将是当陪审团释放该人[不拒绝H0]虽然该人有罪[H1是真的]。
统计学意义为了理解这个话题,让我们考虑一个例子:假设有一家糖果厂每天生产500克的糖果。工厂维修后的一天,一名工人声称他们不再生产500克的糖果,可能是少了或多了。
那么,这名工人凭什么宣称这一错误?那么,我们应该在哪里画一条线来决定糖果条重量的变化呢?这一决定/界限在统计学上具有重要意义。
置信水平bhdjzg,我们有多自信:我们在做决定时有多自信。LOC(置信水平)应大于95%。不接受低于95%的置信度。
显著性水平(α)显著性水平,用最简单的术语来说,就是当事实上是真的时,错误地拒绝零假设的临界概率。这也称为I型错误率。
这是I类错误的概率。它也是拒绝域的大小。
一般来说,在测试中,它是非常低的水平,如0.05(5%)或0.01(1%)。
如果H0在5%的显著性水平上没有被拒绝,那么我们可以说我们的零假设是正确的,有95%的把握。
P值假设我们在1%的显著性水平上进行假设检验。
H0:平均值<X(我们只是假设一个单尾检验的情况。)
我们得到临界值(基于我们使用的测试类型),发现我们的测试统计值大于临界值。因此,我们必须在这里拒绝零假设,因为它位于拒绝域。
如果零假设在1%时被拒绝,那么可以肯定的是,在更高的显著性水平上,比如5%或10%,它会被拒绝。
如果我们的显著性水平低于1%,那么我们是否也必须拒绝我们的假设呢?
是的,有可能发生上述情况,而“p值”正在发挥作用。
p值是可以拒绝零假设的最小显著性水平。
这就是为什么现在很多测试都给出p值,而且它更受欢迎,因为它给出的信息比临界值更多。
对于右尾检验:
p值=P[检验统计量>=检验统计量的观察值]
对于左尾检验:
p值=p[检验统计量<=检验统计量的观察值]
对于双尾检验:
p值=2*p[检验统计量>=|检验统计量的观察值|]
p值决策
我们比较p值和显著性水平(alpha)对零假设做出决定。
如果p值大于alpha,我们不拒绝零假设。
如果p值小于alpha,我们拒绝零假设。
原文链接:https://www.analyticsvidhya.com/blog/2020/07/hypothesis-testing-68351/
欢迎关注磐创AI博客站: http://panchuang.net/
sklearn机器学习中文官方文档: http://sklearn123.com/
欢迎关注磐创博客资源汇总站: http://docs.panchuang.net/