伙伴们遇到过以下情况吗? 每次开始一个研究,脑海里总是会出现疑问。 我的研究需要多少样本量呢? 或者论文答辩的时候,老师问你这个样本量能支撑你的研究结论吗? 或者投稿时,审稿人在反馈中发现你这项研究的受试者量太少了,结果的准确性有保证吗? 那么,当意识到自己的样本量不够时,可能的解决方法是追加实验数据; 是否要让审稿人认同你的受试者量足够,得到的结果可靠?
但是,出于现实的原因,这些方法可能难以实现。 那么,这个时候,大家该如何解决这个样本量的问题呢? 也许你可以试试别的方法。 也就是说,请进行预先分析,估计所需的样本量,确认数据量是否大于估计值。 或者进行事后分析,说明目前的数据量能达到什么样的效果量和统计效果水平,是十分令人信服的。
GPOWER软件可以帮助我们解决一系列样本量的问题。 因此,为了顺利解决这个问题,主编认真整理了“样本量估算”的相关资料,分享给大家!
本期的内容主要从以下几个方面讲解和分享。
一、相关统计概念介绍
二、GPOWER软件的介绍和安装
三、利用GPOWER进行样本量的估算
一、相关统计概念介绍
(一) H0和H1在进行任何研究时,都需要根据现有的理论和经验,事先对研究结果做出预想的实证假设。 这个假说叫做科学假说,用统计用语表示时叫做研究假说,记为H1。 但是,统计学难以直接验证H1的真实性,因此有必要提出与之相对立的假设。 被称为虚无假说,或者无差别假说、零假说、原假说,表示为H0。
在假设验证中,H0总是被视为直接验证的假设,但H1与H0对立,二者择一,因此H1有时也被称为对立假设或预备假设。 假设验证的问题是判断虚无假设H0是否正确,决定是接受还是拒绝虚无假设H0。
)二)类型错误和类型错误,本来假设H0是正确的时候,因为样本的随机性,拒绝H0,犯“舍弃真”的错误,也称为类型错误。 概率为(即假设验证的显著性水平),因此经常成为型错误。
假设H0不正确,但接受H0,犯“打假”的错误,也称为第二类错误、型错误。 概率是。
好的检查是,在样本容量n一定的情况下,应该尽量减小犯这两种错误的概率和。
研究需要多少样本量? 或者说,已经有了研究样本量,有多大概率能得到统计学上有意义的统计结果(这个样本量值得研究吗)? 这些问题都可以通过功率分析(Power Analysis )解决。 那么,要进行功效分析,首先必须调查与分析相关的4个统计量。 样本量(Sample Size )、效果值(Effect Size )、显著性基准)、统计效果(Power ),据了解,这三者可以推断出另一个。 其中
(三)统计效果(检验效果、效力、功率) () ) ) ) ) ) )。
统计效果是指某种检查能够正确拒绝错误的虚无假说的能力。 用1-表示。
统计效果的大小取决于四个条件:
1 .两者整体的不同。 两个群体差异越大或处理效果越大,假设检验的统计效果越大; (出错的概率不变的情况下,1-变大) ) ) ) ) ) ) )。
2 .显现基准:也称为显现水平,是特定的值,是决策基准。 通过p和的决策比较,进行统计决策。
假设H0为真时,观察到的差异完全由随机误差产生的概率称为观察概率p。
dent: 2em;">显著性标准α越大,则β错误越小,从而统计功效1-β越大;反之,α变小,1-β变小3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。
4.样本容量。样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。
(四)效应量(效应大小,Effect Size)效应量,反映处理效应大小的度量。效应量表示两个总体分布的重叠程度。Effect Size 越大,表示两总体重叠的程度越小,效应越明显。其实,两样本平均数的差异本身就是一个效应量。由计算出的Effect Size大小,可由专门的表格中查出两样本分布的重叠的百分比。故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小。或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大。效应值是量化现象强度的数值,在不同的统计方法中统计量会不同。
对于有些小伙伴来说,上面的统计学概念可能有些抽象,下面小编为大家推荐一个网址(https://rpsychologist.com/d3/NHST/),在这个网站上,我们可以可视化的了解各个概念之间的关系。这个可视化是基于一个单样本的Z检验。你可以使用滑块改变样本量、功率、显著性水平和效应大小,以观察抽样分布的变化。如下图(左—双尾;右-单尾):
二、GPOWER软件的简介与安装G*power软件是由德国杜塞尔多夫大学几位乐于分享知识的老师开发的,专门用于统计功效(包括样本量)计算的免费统计软件,在心理学领域有着很高的声誉和认可度。
在官网即可下载软件,网址为:http://www.gpower.hhu.de/
(安装后图表见右图)
下图为软件的主界面(红框内中可依据实验设计选择统计方法;黄框内可依据分析目的选择功效分析类型):
其中,Gpower 中最常见的统计力分析(power analysis)类型包括以下几类:
1.先验 (priori) 分析:根据所给的α水平,统计力水平(1-β)和效应大小(H0和H1的差异),计算样本容量;
2.事后 (post-hoc) 分析:根据N,α,效应大小,得出β;
3.折中 (compromise) 分析:想得到较小的α和较大的1-β,所以α和β之间的权重用q = β/α表示,所以知道 N,q和具体的效应大小,得出α和β。
4.标准(Criterion)分析:根据 1-β、effect size 和 N 计算a 和相关决策标准。
5.敏感性(Sensitivity)分析:根据α、 1-β和N计算effect size 。
三、使用GPOWER进行样本量的估计G.Power的功能强大,即可以计算事后统计检验力(事后分析),也可以进行事前样本量的估计(先验分析)。
基本步骤如下:
1、选择统计方法:(Exact—FisherF test—方差分析t test差异性t检验X2test—卡方检验Z test—非参数检验)
2、进一步选择分类:(这里以t 检验为例)
3、确定想得到的参数:
①A Priori:研究设计时,想知道所需样本量N
②Compromise:α与β固定(不常用)
③Criterion:计算α(一般α为0.01、0.05不需要计算)
④Post hoc:计算研究结果的检验效能(power)——1-β
⑤Sensitivity:实验完成后,计算效应量
一般来说,①、④、⑤比较常用
4、设定各个参数:
Tail:one—单尾;two—双尾。一般选择后者;
Effect size:效应量,t检验里,采用Cohen(1988)的计算方法,小=0.2、中=0.5、大=0.8,不知如何填时,选0.5;
a err prob:一般为0.05、0.01;
Power:检验效能,0.8以上可以;
Allocation ratio:2组样本量n比值
5、最后点击Calculate:
结果里给出了所需样本量。在本例中,结果显示,保证得到效应在0.5(中)的前提下,设定a=0.05并且检验效能为0.8时,需要每组至少有64个样本。
以上就是本期分享的主要内容,希望可以帮助你顺利解决目前的苦恼~
在下期内容中小编会为大家详细讲解各个统计方法下具体是如何用GPOWER进行样本量估计的。
记得关注momo老师,获得更多精彩内容哦~