因此,我听说它说,根据另一个统计检验的结果选择一个统计检验不是一个好主意。这对我来说似乎很奇怪。例如,当其他一些测试表明残差不是正态分布时,人们经常选择使用非参数测试。这种方法似乎已被广泛接受,但似乎与本段的第一句话不一致。我只是希望对这个问题进行澄清。
因此,我听说它说,根据另一个统计检验的结果选择一个统计检验不是一个好主意。这对我来说似乎很奇怪。例如,当其他一些测试表明残差不是正态分布时,人们经常选择使用非参数测试。这种方法似乎已被广泛接受,但似乎与本段的第一句话不一致。我只是希望对这个问题进行澄清。
Answers:
鉴于是观察数据这样极端的,或者更极端的概率是真实的,那么什么是诠释,其中是通过那里是在测试的所产生的选择做了一个相机决策的过程到达那?答案是不可知的(或至少非常不可知的)。通过基于其他概率过程来决定是否进行测试,您对结果的解释变得更加复杂。 H 0 p p p p p预先完全选择样本量和分析计划后,才可以最大程度地解释这些值。在其他情况下,解释会变得困难,这就是为什么它不是一个“好主意”的原因。话虽这么说,这是一种被广泛接受的做法...毕竟,如果您发现计划运行的测试无效,为什么还要费心运行测试?这个问题的答案远不能确定。这全部归结为一个简单的事实,即无效假设重要性测试(的主要使用情况)具有一些难以克服的问题。
例如,当其他一些测试表明残差不是正态分布时,人们经常选择使用非参数测试。这种方法似乎已被广泛接受,但似乎与本段的第一句话不一致。我只是希望对这个问题进行澄清。
是的,很多人都做这种事情,并将第二种检验更改为在拒绝方差相等时可以处理异方差的检验,依此类推。
仅仅因为某些事情是普遍的,并不意味着它一定是明智的。
确实,在某些地方(我不会说出最坏的学科),实际上还教授了许多这种形式的假设检验,要视其他形式的假设检验而定。
这样做的问题是您的过程没有标称属性,有时甚至没有关闭。(另一方面,假设这样的事情根本不考虑潜在的极端违规行为,甚至会更糟。)
几篇论文表明,对于异方差情况,最好是简单地表现为方差不等于,而不是对其进行测试,仅在拒绝时对此进行处理。
在正常情况下,还不清楚。至少在大样本中,在很多情况下,正态性并不是那么关键(但具有讽刺意味的是,对于大样本,只要非正态性不是太疯狂,对正态性的检验就很可能会被拒绝)。一种例外是预测间隔,在这种情况下,您确实确实需要您的分布假设接近正确。
在某种程度上,一个问题是假设检验回答的问题与需要回答的问题不同。您实际上并不需要知道“数据是否真正正常”(几乎总是,先验不会完全正常)。问题是,“非正态程度会严重影响我的推论”。
第二个问题通常要么与样本量无关,要么实际上随着样本量的增加而变得更好-但是假设检验几乎总是会拒绝大样本量。
还有很多地方有强大的,甚至分布免费程序的情况下,这是非常接近,即使在正常的(也可能完全有效远从它的一些相当温和的离职更有效) -在许多情况下,它似乎傻不拿同样谨慎的方法。
其他人已经很好地解释了主要问题,但与潜在问题或相关问题相混淆
对P值的过度谨慎,至多是统计中的一种证据。
不愿意看到统计报告不可避免地是基于选择的组合,有些是基于证据的,有些则是基于先前分析,直觉,猜测,判断,理论等等的组合。
假设我和我谨慎的朋友“ Test Everything”都选择了对数转换作为响应,但是我基于物理推理和以前的数据经验混合得出了这个结论,而“ Test Everything”则基于Box-Cox测试和估计来选择对数刻度参数。
现在我们都使用相同的多元回归。我们的P值是否有不同的解释?根据一种解释,测试一切的P值取决于她之前的推论。我也使用了推论,但是大多数情况下,它们都是非正式的,基于一系列先前项目中的一系列先前图形,计算等。如何报告?
自然,对于“测试一切”和我自己,回归结果完全相同。
明智建议和可疑哲学的相同组合适用于预测变量和功能形式的选择。例如,经济学家被广泛教导要尊重先前的理论讨论并警惕数据监听,在每种情况下都有充分的理由。但在最弱的情况下,有关理论只是文献中先前提出的尝试性建议,很有可能经过一些经验分析。但是,对于许多作者而言,文献参考是神圣的,尽管从现有数据中学习值得怀疑。