在这里加1的技巧是什么?


11

我一直在寻找在此页面上Lillefors测试的蒙特卡洛实现。我不明白这句话:

模拟中的计算中存在随机误差。但是,由于在计算P值时将分子和分母加1的技巧,可以在不考虑随机性的情况下直接使用。

将分子和分母加1的技巧是什么意思?

相关的代码在这里:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

您可以在此处添加相关上下文吗?
gung-恢复莫妮卡

4
对于概率的蒙特卡洛估计,看起来像拉普拉斯平滑,将其缩小到1/2;正如@Tim指出的那样,主要的效果可能是避免获得p值0(不过,除非您进行0模拟,否则没有像他所说的那样被0除的风险)。但是,我真的不明白为什么这允许您“不考虑随机性”地使用它。
2015年

2
您是否直接写了Geyer来询问句子的含义?
Alexis 2015年

@Alexis,不,但这是个好主意。
Aksakal'1

@Dougal,是的,看起来确实像拉普拉斯平滑。目前尚不清楚他为什么在这里应用它。
Aksakal,2015年

Answers:


6

参考页面上的说明是

在零假设下,当同时考虑数据的随机性和模拟的随机性时,概率恰好是。Pr(Pk/nsim)k/nsim

要理解这一点,我们必须查看代码,其中的关键行(缩写为缩写)是

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

一个突出的问题是代码与引号不匹配。 我们如何调和他们?尝试从报价的最后一半开始。我们可能将过程解释为包括以下步骤:

  1. 根据某些概率定律收集独立且均匀分布的数据。应用测试过程(在代码中实现为)以产生数字。X1,X2,,XnGtfredT0=t(X1,,Xn)

  2. 根据具有机率定律的零假设,通过计算机生成可比较的数据集,每个数据集的大小为。将应用于每个这样的数据集以产生数字。N=nsimnFtNT1,T2,,TN

  3. 计算

    P=(i=1NI(Ti>T0)+1)/(N+1).

    (“ ”是由矢量值比较实现的指示器功能中的代码。)右手侧被理解为是凭借的随机同步的随机性(实际测试统计量)所述的随机性(模拟测试统计信息)。 Id.star > d.hatT0Ti

地说,数据符合零假设是断言。选择一个测试大小,。 将两侧都乘以并减去表明,任意数的机会是超过 这仅表示位于所有测试统计信息的排序集合的顶部之内。由于(按施工)F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0与所有无关,当是连续分布时,该机会将是整数部分表示的分数;即,它将与提供的值完全相等是整数 ; 也就是说,当。TiF(N+1)α

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

对于任何应被称为“ p值”的数量,这当然都是我们想要实现的事情之一:它应该在上具有均匀的分布。假设相当大,那么任何都接近于形式的某个分数,则此将具有接近均一的形式分配。(要了解p值所需的其他条件,请阅读我发布的有关p值的对话框。[0,1]N+1αk/(N+1)=k/(nsim+1)P

显然,引号无论出现在哪里都应使用“ ”而不是“ ”。nsim+1nsim


5

我相信在这里,两者都加了1,因为观察到的统计量包含在参考分布中;如果是这种情况,那是因为p值定义的“至少一样大”。

我不确定,因为文字似乎在说些不同,但这就是我这样做的原因。


1
@whuber我看不出我如何同意。并非所有测试都是似然比测试;当它们不是轻快铁时,可以用似然比来解释它吗?
Glen_b-恢复莫妮卡

1
@whuber当然可以。但是,例如,考虑一下Wilcoxon-Mann-Whitney(或者实际上,更广泛的排列测试)。有许多广泛使用的完全合理的测试,既不是Lilliefors测试也不是似然比测试。当有一个明确的替代方案需要对它进行幂运算时,通常可以构造一个有意义的检验统计量,其中检验统计量所给出的样本空间上的排序是很有意义的,并且在各种各样的替代物中都具有合理的属性。
Glen_b-恢复莫妮卡2015年

1
当然,当得出一个检验统计量时(就采取更大的值,无论是较大的,较小的还是两者兼有)而言,一种测试统计量与之相对应,一种检验方法就是“对另一种方法感兴趣。 “-但是,即使有人要使用不可接受的(实际上,甚至是无用的测试),我在回答中概述的将观察到的样本包括在模拟结果中的原则仍然适用。一旦下达命令,即使不是最佳命令,在计算p值时,观察到的情况仍然属于计数。
Glen_b-恢复莫妮卡2015年

2
@whuber,我们现在可能相距不远。在选择一个合理的测试统计量时,我们当然希望对某些东西有吸引力。但是,一旦有了测试统计信息(就像在空值下进行模拟时所必须具备的那样),我们就已经完成了。一旦有了,我们将观察到的情况包括在p值的计算中的原因是因为p值是多少。
Glen_b-恢复莫妮卡2015年

1
我认为我们之间没有任何差异。(请注意,我自己的回答清楚地表明,在计数中包括观察到的样本是适当的。)我的评论并非针对您对问题的回答(我同意并支持),而仅针对问题短语“至少一样大。” 我在该网站(以及其他地方)的许多地方都看到了该短语的误解,以至于希望引起读者对它真正含义的注意。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.