小伙伴们有没有过遇到过以下这几种情况:每次开始一个研究前,脑子里总会冒出一个疑问,我的研究需要多少样本量呢?或者论文答辩时,当老师提到你这个样本量能支撑你的研究结论吗?又或者在投稿时,审稿人在反馈意见中提到你这个研究的被试量太少了,结果的准确性有保证吗?那么这时当发现自己样本量不够时,能想到的解决方法就是要么补实验数据;要么让审稿人信服你的被试量是足够的,得到的结果是可靠的。
然而有时因为现实原因,以上方法很难实现。那么,此时大家该怎样去解决这个样本量的问题呢,或许可以尝试另一种方法,即:进行先验分析,估计所需要的样本量,然后看看你的数据量能否大于估计的样本量。或者进行事后分析,说明你现目前的数据量可以达到什么样的效应量和统计功效水平,是足够让人信服的。
而GPOWER软件就可以帮助我们解决一系列样本量的问题。因此为了帮助大家顺利解决这一问题,小编认真的整理了“样本量估计”的相关材料分享给大家!!
本期内容主要从以下几个方面进行讲解分享:
一、相关统计概念介绍
二、GPOWER软件的简介与安装
三、使用GPOWER进行样本量的估计
一、相关统计概念介绍
(一)H0与H1
在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果作出一种预想的希望证实的假设。这种假设叫科学假设,用统计术语表示时叫研究假设,记作H1。然而在统计学中很难直接检验H1的真实性,因此需要建立与之对立的假设,称作虚无假设,或叫无差假设、零假设、原假设,记为H0。
在假设检验中H0总是作为直接被检验的假设,而H1与H0对立,二者择一,因而H1有时又叫做对立假设或备择假设。假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0。
(二)Ⅰ型错误和Ⅱ型错误
当原假设H0正确时,由于样本的随机性,拒绝了H0,犯了“弃真”错误,又称为第一类错误,Ⅰ型错误。概率为α(即假设检验的显著性水平),故常常成为α型错误。
当原假设H0不正确时,但接受了H0,犯了“取伪”错误,又称为第二类错误,Ⅱ型错误。概率为β。
一个好的检验应该在样本容量n一定的情况下,使犯这两类错误的概率α和β都尽可能小。
而我们一般说研究需要多大样本量?或者研究样本量已经有了,有多大概率可以得出有统计学意义的统计结果(这个样本量值得去做研究吗)?这些问题都可以通过功效分析(PowerAnalysis)来解决。那么要进行功效分析,先要了解一下分析中涉及4个统计量:样本量(SampleSize)、效应值(EffectSize)、显著标准(Alpha)、统计功效(Power),知其三个可推断另外一个。其中
(三)统计功效(检验功效,效力,Power)
统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。用1-β表示。
统计功效的大小取决于四个条件:
1.两总体差异。当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大;(在α错误概率不变的情况下,1-β变大)
2.显著性标准α:也称显著性水平,是一个特定的值,一个决策标准。通过p与α的决策比较,作出统计决策。
而当假设H0是真实的时候,观察到的差异完全是由随机误差所致的概率称为观察概率p。
显著性标准α越大,则β错误越小,从而统计功效1-β越大;反之,α变小,1-β变小
3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。
4.样本容量。样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。
(四)效应量(效应大小,EffectSize)
效应量,反映处理效应大小的度量。效应量表示两个总体分布的重叠程度。EffectSize越大,表示两总体重叠的程度越小,效应越明显。其实,两样本平均数的差异本身就是一个效应量。由计算出的EffectSize大小,可由专门的表格中查出两样本分布的重叠的百分比。故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小。或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大。效应值是量化现象强度的数值,在不同的统计方法中统计量会不同。
对于有些小伙伴来说,上面的统计学概念可能有些抽象,下面小编为大家推荐一个网址(
转载请注明:http://www.0431gb208.com/sjszyzl/4153.html