为什么要使用“随机”置信度或可信区间?


16

我最近正在阅读一篇论文,该论文将随机性纳入其置信度和可信区间中,我想知道这是否是标准的(如果是标准的话,为什么这样做是合理的)。为了设置符号,假设我们的数据是并且我们有兴趣为参数创建间隔。我习惯于通过构建函数来构建置信度/可信度区间:θ ΘXXθΘ

FXΘ{01个}

并让我们的间隔为。一世={θΘFXθ=1个}

从某种意义上说,这是随机的,它取决于数据,但条件是它只是一个间隔。相反,本文定义

GXΘ[01个]

以及上的iid统一随机变量的集合。它定义关联的间隔为。请注意,除了数据之外,这很大程度上取决于辅助随机性。 [ 0 1 ] = { θ ∈ Θ{üθ}θΘ[01个]一世={θΘFXθüθ}

我很好奇为什么有人会这样做。我认为“放松”从的函数到类的间隔的概念是有意义的。这是某种加权的置信区间。我不知道有任何引用(并且会喜欢任何指针),但是看起来很自然。但是,我无法想到增加辅助随机性的任何原因。FXGX

任何文献或理由这样做的指针将不胜感激!


5
(+1)这称为随机过程。 它们是统计估计和测试框架的标准部分,因此您几乎可以依靠任何严格的教科书来提供解释。使用它们的其他动机可以在博弈论文献中找到。
ub

感谢您的回复。在阅读此注释后,我意识到例如引导程序适合该框架,但是在这种情况下,随机化的原因很明确(您无权访问f,只有g)。在我的情况下,作者显式计算,然后看g x。尽管我有很多统计资料教科书,但我什么地方都看不到……您有建议的文字吗?FXGX
QQQ 2015年

3
实际上,引导程序不是随机过程。这是一个确定的过程,其近似计算是通过随机采样进行的。
ub

Answers:


4

理论上有时会使用随机程序因为它简化了理论。在典型的统计问题中,它在实践中没有意义,而在游戏理论设置中则有意义。

我看到它在实践中使用的唯一原因是,它是否在某种程度上简化了计算。

从理论上讲,可以从充分性原则上主张不应使用它:统计结论应仅基于足够的数据摘要,而随机化则引入了无关随机变量依赖关系,该无关随机变量 U并不是数据充分摘要的一部分。ü

UPDATE  

为了回答下面沃布的评论,在这里引用:“为什么随机程序“在实践中没有意义”?正如其他人指出的那样,实验者完全愿意在他们的实验数据的构建中使用随机性,例如治疗和控制的随机分配。 ,那么在随后的数据分析中使用随机化有何不同(不切实际或令人反感)?”

好吧,为了获得数据而进行的实验随机化是有目的的,主要是打破因果关系链。是否有效以及何时有效是另一个讨论。使用随机化作为分析的一部分的目的是什么?我见过的唯一原因是它使数学理论更加完整!只要可以就可以了。在博弈论的背景下,当有实际对手时,我会随机分配以使他感到困惑。在真实的决策环境中(出售还是不出售?),必须做出决定,并且如果数据中没有证据,则可能只是投掷硬币。但是在科学的背景下,问题是我们可以学习什么从数据来看,随机化似乎不合适。我看不到任何真正的优势!如果您不同意,您是否有可以说服生物学家或化学家的论点?(在这里,我不认为模拟是引导程序或MCMC的一部分。)


1
为什么随机程序“在实践中没有意义”?正如其他人指出的那样,实验人员完全愿意在其实验数据的构建中使用随机化,例如治疗和控制的随机分配,因此在随后的数据分析中使用随机化有何不同(且不切实际或令人反感)?
ub

1
@kjetil我想您可能还没有完成有关充裕性原则的陈述,似乎已经切断了中间句(“统计结论应...”)。
Silverfish

1
(+1)但我认为这是调用“充分性原则”的问题,其理由是,一旦您知道足够统计量的观测值,就将数据的任何其他方面都考虑在内就等于引入了多余的随机性。ü。因此,有人提议这样做就不会为自给原则提供参考。另请参阅Basu(1978),“统计实验中的随机化”,FSU统计报告M466,以了解认真建议的几个随机程序。
Scortchi-恢复莫妮卡

1
@whuber:这是一个明确的,有原则的论据,认为随机化在获取数据方面可能是有利的。(它打破了因果链)。使用随机化作为分析的一部分的原则性论点是什么?
kjetil b halvorsen

1
Kjetil:它使您能够实现预期的风险功能,而不是接受不是您想要的风险功能(通常以标称尺寸和功率的形式)。而且,如果一个程序在理论上是有用的,那么除了不实用性之外(在随机程序中通常不是这种情况),在实践中当然不会反对它的使用。因此,您的问题应该转过来思考:要证明使用随机程序存在问题是的负担。您如何做到这一点而又不矛盾自己?
ub

3

这个想法指的是测试,但是鉴于测试和置信区间的双重性,相同的逻辑适用于CI。

基本上,随机测试可确保也可以为离散值实验获得给定的测试大小。

α=0.05pH0p=0.5H1个p<0.5ñ=10

H0ķ=2ppbinom(2,10,.5)ķ=1个H0

ķ=2


α

好吧,我想让我们回到了统计的历史上,当时RA Fisher随意决定以5%的显着性水平进行工作,以决定是否需要进一步研究一些初始证据。众所周知,尽管缺乏良好的决策理论基础,但在许多领域,5%的标准已变成一种金标准。
Christoph Hanck
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.