瓦伦丁·阿姆海因(Valentin Amrhein),桑德·格陵兰(Sander Greenland),布莱克·麦克沙恩(Blake McShane)和800多个签署国呼吁结束大肆宣传的主张,并取消可能产生的关键影响。
稍后包含如下语句:
再一次,我们不主张禁止使用P值,置信区间或其他统计指标,而只是禁止对它们进行分类。这包括在统计上是否有意义的二分法,以及基于其他统计量(例如贝叶斯因子)的分类。
我想我可以理解,下面的图像并不表示这两项研究不同意,因为其中一项“排除”了无效,而另一项则没有。但是这篇文章似乎比我理解的要深入得多。
到最后,似乎有四个要点。对于那些阅读统计数据而不是编写统计数据的人来说,是否可以用更简单的术语来概括这些内容?
在谈论兼容性间隔时,请记住四件事。
首先,仅在给出假设的前提下,因为间隔给出的值与数据最兼容,这并不意味着其外的值是不兼容的。他们只是不太兼容...
其次,在给定假设的情况下,并非内部的所有值都与数据同等兼容...
第三,就像它产生的0.05阈值一样,用于计算间隔的默认95%本身就是一个任意约定...
最后,也是最重要的一点,要谦虚:兼容性评估取决于用于计算间隔的统计假设的正确性...