这是关于统计学和其他科学交叉的讨论问题。我经常遇到同样的问题:我领域的研究人员倾向于说,当p值不小于显着性水平时,没有任何影响。一开始,我经常回答这不是假设检验的工作原理。鉴于这个问题多久出现一次,我想与经验丰富的统计学家讨论这个问题。
让我们考虑一下 “最佳出版集团”《自然通讯生物学》最近在科学期刊上发表的一篇论文(有多个示例,但我们只关注其中一个)
研究人员通过以下方式解释不具有统计意义的结果:
因此,长期适度的热量限制可以延长寿命并增强灵长类动物的健康,但它会影响大脑灰质的完整性,而不会影响认知能力。
证明:
然而,对照和限制热量的动物在Barnes迷宫任务中的表现没有差异(LME:F = 0.05,p = 0.82;图2a)。同样,自发的轮换任务也没有揭示对照动物和受卡路里限制的动物之间的任何差异(LME:F = 1.63,p = 0.22;图2b)。
作者还提出了对缺乏效果的解释-但关键不是解释,而是主张本身。所提供的图对我来说看起来很不一样(图2)。
此外,作者忽略了先验知识:
已经报道了热量限制对大鼠以及人类大脑和情绪功能的有害影响
对于庞大的样本量,我可以理解相同的主张(没有影响=在那里没有实际的显着影响),但是在特定情况下,使用了复杂的测试,而且对我来说执行功率计算并不明显。
问题:
我是否忽略了使他们的结论成立的任何细节?
考虑到需要报告科学中的负面结果,如何证明这不是“没有结果”(),而是“负面结果(例如,各组之间没有差异)”使用统计数据?我了解到,对于巨大的样本量,即使与零值的偏差很小,也会导致拒绝,但让我们假设我们拥有理想的数据,并且仍然需要证明零值实际上是正确的。
统计学家是否应该始终坚持数学上正确的结论,例如“拥有这种能力,我们无法检测出巨大的影响”?来自其他领域的研究人员强烈不喜欢这种负面结果的表述。
我很高兴听到对这个问题的任何想法,并且已经阅读并理解了该网站上的相关问题。从统计的角度来看,对问题2)-3)有明确的答案,但是我想了解在跨学科对话的情况下必须如何回答这些问题。
UPD:我认为阴性结果的一个很好的例子是医学试验的第一阶段,即安全性。什么时候科学家可以确定这种药物是安全的?我猜他们将两组进行比较并对此数据进行统计。有没有办法说这种药是安全的?Cochrane使用准确的“未发现副作用”,但医生说这种药物是安全的。当描述的准确性和简单性之间达到平衡时,我们可以说“对健康没有影响”吗?