关于类似问题的普遍共识是:将结果称为“高度重要”是错误的吗?“高度显着”是一种有效的(尽管不是特定的)方式,用于描述p值远低于预设的显着性阈值的关联强度。但是,如何描述稍微高于阈值的p 值呢?我已经看到一些论文使用诸如“有些重要”,“几乎重要”,“接近重要性”之类的术语。我发现这些术语有些不切实际,在某些情况下,这是一种界限分明的卑鄙的方式,可以从有意义的结果中排除有意义的结果。这些术语可以用来描述“仅仅错过”您的p值临界值的结果吗?
关于类似问题的普遍共识是:将结果称为“高度重要”是错误的吗?“高度显着”是一种有效的(尽管不是特定的)方式,用于描述p值远低于预设的显着性阈值的关联强度。但是,如何描述稍微高于阈值的p 值呢?我已经看到一些论文使用诸如“有些重要”,“几乎重要”,“接近重要性”之类的术语。我发现这些术语有些不切实际,在某些情况下,这是一种界限分明的卑鄙的方式,可以从有意义的结果中排除有意义的结果。这些术语可以用来描述“仅仅错过”您的p值临界值的结果吗?
Answers:
如果您想让“重要性”承认学位,那么就足够公平(“有点重要”,“相当重要”),但要避免使用一些词组来暗示您仍然对阈值的想法有所了解,例如“几乎重要” ,“接近重要性”或“处于重要时刻”(我最喜欢“博客可能出现的错误”中“仍然不重要” ),如果您不想表现得绝望的话。
从我的角度来看,这个问题归结为进行重要性测试的实际含义。重要性检验被设计为做出拒绝否定假设或不否定假设的决定的手段。费舍尔本人引入了臭名昭著的0.05规则来做出(任意)决定。
基本上,重要性测试的逻辑是,用户必须在收集数据之前指定一个alpha级别来拒绝无效假设(通常为0.05)。在完成显着性测试后,如果p值小于alpha级别,则用户将拒绝null(否则将失败)。
之所以不能宣布某项效果非常显着(例如,在0.001水平)是因为您找不到比您打算发现的证据更强大的证据。因此,如果在测试前将alpha值设置为0.05,则无论p值多么小,都只能找到0.05的证据。同样,说“有些显着”或“接近显着”的效果也没有多大意义,因为您选择了0.05的这个任意标准。如果您从字面上解释显着性检验的逻辑,则大于0.05的值都不是显着的。
我同意,诸如“接近重要性”之类的术语通常用于增强出版前景。但是,我不认为应该为此归咎于作者,因为在某些科学中,当前的出版文化仍然严重依赖于0.05的“圣杯”。
其中一些问题已在以下文章中讨论:
Gigerenzer,G。(2004)。无忧的统计。社会经济杂志,33(5),587-606。
Royall,R。(1997)。统计证据:似然范例(第71卷)。CRC出版社。
这个湿滑的斜率可以追溯到Fisher-Neyman / Pearson框架进行零假设假设显着性检验(NHST)。一方面,人们想对结果在原假设下的可能性进行定量评估(例如,效应量)。另一方面,在一天结束时,您需要一个单独的决定,即您的结果是否可能仅由于偶然性而产生。我们最终得到的是一种不太令人满意的混合方法。
在大多数学科中,将显着性的常规p设置为0.05,但确实没有理由将其设置为p。当我审阅一篇论文时,只要方法论是合理的,并且包括所有分析,数据等在内的整个图片都讲述了一个一致且可信的故事,我绝对不会认为作者认为0.06有意义,甚至是0.07。当作者试图用琐碎的数据以较小的效果制作一个故事时,就会遇到问题。相反,即使达到常规的p <0.05的意义,我也可能不会完全“相信”一项测试在实际中有意义。我的一位同事曾经说过:“您的统计数据应该简单地备份您的数据中已经显而易见的数据。”
话虽如此,我认为瓦西廖夫是正确的。鉴于发布系统已损坏,您几乎必须包含p值,因此,即使它需要像“ marginally”(我更喜欢)这样的形容词,也几乎必须使用“有意义”一词来认真对待。您总是可以在同行评审中与之抗争,但您必须首先到达那里。
两个p值本身之间的差异通常不大。因此,p值是否为0.05、0.049、0.051 ...都没关系...
关于p值作为关联强度的度量:p值不是直接关联强度的度量。p值是在假设参数假定为0的情况下发现与您观察到的数据相同或更多的极端概率的概率(如果您对原假设感兴趣,请参阅Nick Cox的评论)。但是,这通常不是研究人员感兴趣的数量。许多研究人员对回答诸如“参数大于某个选定的临界值的概率是多少?”之类的问题相当感兴趣。如果您对此感兴趣,则需要在模型中合并其他先验信息。
(当然不是效果的强度)。对于这样的“连续主义者”,“几乎有效”是描述具有中等p值的结果的明智方式。当人们将这两种哲学混合在一起时,就会出现问题。(顺便说一句-人们经常假设这些图清晰地映射到Neyman / Pearson和Fisher上,但事实并非如此;因此,我承认他们的说法很笨拙)。有关此主题的博客文章,请访问此处:https://scientistseessquirrel.wordpress.com/2015/11/16/is-nearly-significant-ridiculous/