IID数据的悖论(至少对我而言)


24

就我在统计上的综合(和稀缺)知识而言,我理解如果是同上的随机变量,则该术语暗示它们是独立且均等分布的。X1,X2,...,Xn

我在这里关心的是iid样本的前一个属性,其内容为:

p(Xn|Xi1,Xi2,...,Xik)=p(Xn),

对于不同 st任何集合。 1 Ĵ < Ñij1ij<n

但是,人们知道,具有相同分布的独立样本的集合提供了有关分布结构的信息,因此,在上述情况下,还提供了有关的信息,因此,实际上不应该是: p X Ñ | X 1X 2X ķ= p X ÑXn

pXñ|X一世1个X一世2X一世ķ=pXñ

我知道我是谬论的受害者,但我不知道为什么。请帮我解决这个问题。


你知道贝叶斯规则吗?听到经典。vs贝叶斯统计?先辈?
马修·冈恩

1
我在问题末尾没有提出论点。您能说得更清楚些吗?
Glen_b-恢复莫妮卡

@Glen_b您不遵循的确切含义是什么?到底是什么意思?我试图用不同的逻辑说平等和不平等似乎是合理的,这是一个悖论。
Cupitor

这里没有悖论,只是没有应用适当的定义。当您忽略所用单词的含义时,您不能声称自己有悖论!在这种情况下,将独立的定义与概率的定义进行比较将揭示错误。
ub

@whuber,我认为您已经注意到我的问题标题中的“(至少对我而言)”,以及我寻求帮助以找到我的论点的“谬误”的事实,这表明事实确实不是一个真正的悖论。
Cupitor

Answers:


30

我认为您正在将分布的估计模型随机变量混淆。让我们将独立性假设重写为: 表示如果知道X n(并且可以通过一组参数θ进行识别

(1)PXñ|θX一世1个X一世2X一世ķ=PXñ|θ
Xñθ),则假设您已经观察到一些样本,则分布不会改变。

例如,将视为代表硬币第n次抛掷的结果的随机变量。知道的概率的硬币(其,顺便说一句,假定在编码θ)是足以知道的分布X Ñ。特别地,先前抛掷的结果不会改变第n次抛掷头部尾巴的概率,并且1 成立。XññθXññ1个

但是请注意,Pθ|XñPθ|X一世1个X一世2X一世ķ


非常感谢你。相当明确。相当可笑的是,我不久前就猜到了这样的答案,但是我却忘了……。据我所知,谬误与隐含假设“模型”有关,该模型可以参数化随机变量的分布。我说对了吗?
Cupitor

1
@Cupitor:我很高兴它很有用。是的,根据模型,独立随机变量不会相互影响。但是,当您从基础(真实)分布中看到更多样本时(无论独立性假设如何),给定分布产生一系列结果变化的可能性有多大。
索比2015年

15

XθPXñXñ-1个X1个θ=PXñθ

θθθ

Xñθ

贝叶斯与古典统计学家

X一世

  • PX一世=Hθθ
  • θ

θθ

这要去哪里

ñ

PXñ=HXñ-1个Xñ-2X1个=PXñ=H=θ
θ

贝叶斯对主观概率的深刻理解是,从她的角度来看,重要的是概率。如果她连续看到10个头,则第11个头的可能性更高,因为连续10个头会使人相信硬币偏向正面。

PX11=HX10=HX9=HX1个=H>PX1个=H

θθθ

PX11=HX10=HX9=HX1个=Hθ=PX1个=Hθ=θ

θθ

进一步说明

我已经尽力在这里做了简短的介绍,但是我所做的充其量只是肤浅的,从某种意义上讲,这些概念是很深的。如果您想深入探讨概率论,那么Savage在1954年出版的《统计学基础》一书就是经典。针对贝叶斯与常客的Google交易会大量涌现。

思考IID抽奖的另一种方法是de Finetti定理可交换的概念。在贝叶斯框架中,可交换性等同于以某个潜在随机变量(在这种情况下为硬币的偏斜度)为条件的独立性。


本质上,贝叶斯方法不会将“ iid随机变量”声明视为必须是IID 的公理,而是将其视为非常强的先前假设(如果有更强的证据表明,给定的可能性极小)假设是正确的,那么这种“在给定条件下的怀疑”将反映在结果中。
彼得斯(Peteris)2015年

非常感谢您的详尽回答。我对此表示赞同,但我认为Sobi的答案更明确地指出了问题所在,即隐式假设模型结构(或者据我
所知

1
@Matthew Gunn:整洁,透彻,而且解释得很好!我从您的回答中学到了一些东西,谢谢!
索比2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.