除了Durbin-Watson,还有哪些假设检验可以得出不确定的结果?


10

所述德宾沃森检验统计量可以位于一个不确定区域,其中它是不可能要么拒绝或不拒绝零假设(在这种情况下,零自相关的)。

还有哪些其他统计检验可以得出“不确定”的结果?

对于为什么这组测试无法做出二进制的“拒绝” /“拒绝失败”决定,是否有一般的解释(挥手就好)?

如果有人可以将决策理论的涵义作为他们对后一个查询的答案的一部分,那将是一个额外的奖励—是否存在(结论)附加类别是否意味着我们需要考虑第一类和第二类的成本错误以更复杂的方式?


2
有点偏离主题,但随机测试具有这种味道。对于某些数据值,您需要对接受和拒绝进行随机化处理。
Christoph Hanck

@ChristophHanck谢谢,这是一个我没有注意到的有趣的联系。这不是我的初衷,但我故意使这个问题含糊不清,以期成为一个综合解决方案-根据答案,我稍后可能会重点关注。
银鱼

Answers:


10

维基百科文章解释说,检验统计量的零假设下的分布依赖于设计矩阵的特别是在回归中使用的预测值的配置。德宾&沃森计算检验统计量在其下试验阳性自相关必须拒绝,在给定的显着性水平,对于下界任何设计矩阵,&上限在其上测试必须不能拒绝对任何设计矩阵。“不确定区域”仅是您必须计算出精确的临界值(考虑到设计矩阵)才能得到确定答案的区域。

类似的情况是,当您仅知道t统计量,而不是样本量时,必须执行一个样本的单尾t检验:1.645和6.31(对应于无限的自由度,只有一个)大小为0.05的测试的界限。

就决策理论而言,除了样本变化之外,您还需要考虑一个新的不确定性来源,但是我不明白为什么不应该以与复合零假设相同的方式来应用它。无论您如何到达那里,您都与未知参数的人处于同一情况。因此,如果您需要在控制所有可能性的I类错误时做出拒绝/保留决定,请保守地拒绝(例如,当Durbin-Watson统计量在下限以下或t统计量在6.31以上时)。

†也许您丢了桌子;但是可以记住一些关于标准高斯的临界值,以及柯西分位数函数的公式。


(+1)谢谢。我知道Durbin-Watson检验就是这种情况(应该在我的问题中确实提到过),但想知道这是否是更普遍现象的示例,如果是,则它们是否基本上都以相同的方式工作。我的猜测是,例如,当执行某些测试而只访问摘要数据(不一定在回归中)时,这种情况可能会发生,但是DW是唯一让我记得看到的临界值上限和下限已编译并制成表格的情况。如果您对我如何使问题更有针对性有任何想法,将非常欢迎。
银鱼2015年

第一个问题有点含糊(“还有哪些其他统计检验[?]?”,但是我认为您不回答第二个问题就无法澄清它(“是否有一般性的解释[...]?”)自己-总的来说,我认为一切都很好。
Scortchi-恢复莫妮卡

7

结果可能不确定的测试的另一个示例是当仅提供比例而不是样本大小时的比例二项式检验。这并非完全不现实-我们经常听到或听到报道不佳的声称“ 73%的人同意...”的说法,依此类推,其中没有分母。

例如,假设我们只知道样本比例四舍五入到最接近的整数百分比,并且我们希望在水平下针对来测试。H0:π=0.5H1:π0.5α=0.05

如果我们观察到的比例为 则观察到的比例的样本大小必须至少为19,因为是分母最低的部分,它将舍入为。我们不知道观察到的成功次数是否实际上是19中的1、20中的1、21中的1、22中的1、37中的2、38中的2、55中的3、5中的5在1000中的100或50 ...但是无论是哪种,结果在水平下都是有意义的。p=5%1195%α=0.05

另一方面,如果我们知道样本比例为那么我们不知道观察到的成功次数是100中的49(在此级别上不重要)还是10,000中的4900(这是不重要的)。才有意义)。因此,在这种情况下,结果是不确定的。p=49%

请注意,使用四舍五入的百分比时,没有“拒绝失败”区域:即使也与100,000次中的49,500次成功(将导致拒绝)以及2次试验中的1次成功等样本一致,这将导致无法拒绝。p=50%H0

与Durbin-Watson检验不同,我从未见过有显着百分比的列表结果。由于没有临界值的上限和下限,因此这种情况更加微妙。的结果显然是不确定的,因为零次成功在一个审判将是微不足道又中了一千万试验没有成功将是非常显著。我们已经看到尚无定论,但是有明显的结果,例如介于两者之间的。此外,缺少截止值不仅是因为和的异常情况。玩一点,最低有效的样本对应于p=0%p=50%p=5%p=0%p=100%p=16%在19个样本中有3次成功,在这种情况下因此很有意义;为我们可能具有在6个试验1个成功这是无关紧要的,所以这种情况是不确定的(因为有清楚其它样品用,其会很重要);对于,在11个试验中可能有2次成功(微不足道,),因此这种情况也没有定论;但对于,最小可能样本是19个试验中3次成功,其中所以这再次很有意义。Pr(X3)0.00221<0.025p=17%Pr(X1)0.109>0.025p=16%p=18%Pr(X2)0.0327>0.025p=19%Pr(X3)0.0106<0.025

实际上,是低于50%的最高舍入百分比,在5%的水平上无疑是显着的(其最高p值将代表17次试验中的4次成功,并且只是显着),而是最低的非零结果,没有定论(因为它可能对应于8次试验中的1次成功)。从上面的示例可以看出,两者之间发生的事情更加复杂!下图在处有红线:该线下方的点无疑是有效的,但上方的点尚无定论。p值的模式应使观察到的百分比不会出现单一的上下限,以使结果明确地有意义。p=24%p=13%α=0.05

样本量未知的二项式检验的最小显着p值

R代码

# need rounding function that rounds 5 up
round2 = function(x, n) {
  posneg = sign(x)
  z = abs(x)*10^n
  z = z + 0.5
  z = trunc(z)
  z = z/10^n
  z*posneg
}

# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
    trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
    binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)

# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
    max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)

# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05

# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
    pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")

(舍入代码已从此StackOverflow问题中删除。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.