您的说法是正确的,因为样本大小会影响功效(即1-II型错误),但不会影响I型错误。一个普遍的误解是,当样本量较小时,这样的p值(正确解释)不太可靠或无效-Friston 2012的非常有趣的文章对此有一个有趣的看法[1]。
话虽这么说,但研究不足的问题是真实的,我的说法在很大程度上是正确的,其措辞有点不精确。
动力不足的研究的基本问题是,尽管假设检验中的假阳性率(I型错误)是固定的,但真正的阳性率(功效)却下降了。因此,在动力不足的研究中,阳性(=显着)结果不太可能是真实阳性。这个想法以错误发现率[2]表示,另请参见[3]。这似乎是引述所指。
关于动力不足的研究经常被提及的另一个问题是,它们导致高估了效应大小。原因是:a)功效较低,您对真实效果的估计将在其真实值附近变得更加可变(随机),并且b)当功效较低时,只有那些效应中最强的才会通过有效过滤器。应该补充一点,尽管这是一个报告问题,可以通过讨论和报告所有结果而不仅仅是重大影响来轻松解决。
最后,动力不足的研究中的一个重要的实际问题是,低功率会增加统计问题(例如,估计量的偏差),以及变戏法和类似的p-hack战术的诱惑。当功率较低时,使用这些“研究者自由度”最为有效,并且THIS毕竟会增加I型错误,例如,参见[4]。
由于所有这些原因,因此,我确实会对动力不足的研究表示怀疑。
[1] Friston,K.(2012)非统计性评论者的十个讽刺规则。NeuroImage,61,1300-1310。
[2] https://en.wikipedia.org/wiki/False_discovery_rate
[3]按钮,KS;JPA约阿尼迪斯;Mokrysz,C .;BA Nosek;弗林特,J. Robinson,ESJ和Munafo,MR(2013)电源故障:为什么小样本量会破坏神经科学的可靠性。纳特 神经科学杂志,14,365-376
[4] Simmons,JP;Nelson,LD&Simonsohn,U.(2011)错误正面心理学:数据收集和分析中未公开的灵活性允许呈现任何有意义的东西。Psychol Sci。,22,1359-1366。