使用条件分布从边际分布采样?


12

我想从单变量密度采样,但我只知道这种关系:fX

fX(x)=fX|Y(x|y)fY(y)dy.

我想避免使用MCMC(直接在整数表示上),并且由于和易于采样,因此我在考虑使用以下采样器:f Yy fX|Y(x|y)Fÿÿ

  1. 对于。Ĵ=1个ñ
  2. 样本。ÿĴFÿ
  3. 样本。XĴFX|ÿ|ÿĴ

然后,我将得到对,仅获取边际样本。 它是否正确?x 1x NX1个ÿ1个XñÿñX1个Xñ

Answers:


10

是的,这是正确的。基本上,你有

FXÿXÿ=FX|ÿX|ÿFÿÿ

正如您所说,您可以从关节密度中取样。仅从样本中选取 s,就可以从边际分布中获取样本。X

这是因为忽略的行为类似于对其进行积分。让我们通过一个例子来理解这一点。ÿ

假设 =母亲的身高, =女儿的身高。目的是从获取一个样本以了解女儿与母亲的身高之间的关系。(我假设家庭中只有一个女儿,并且将人口限制在所有18岁以上的女儿中,以确保完全成长)。Y X Y XÿXÿ

您外出并获得代表性样本

X1个ÿ1个Xñÿñ

因此,对于每个母亲,您都有他们女儿的身高。和之间应该有明确的关系。现在假设从数据集中,您忽略了子代上的所有数据(除去),那么您拥有什么?您正好有随机选择的母亲的身高,这是的边距的倍。Y Y N XXÿÿñX


谢谢你,这是有帮助的。您是否知道此抽样策略是否可以与Gibbs抽样联系起来以正式证明其合理性?
罗德

1
如果您可以轻松地从联合分布中采样,则无需理会来获得的边际就不需要理由。这是很平常的事情。也许可以说是一个Linchpin变量,但是由于您不需要Gibbs采样来从进行采样,因此这里不需要MCMC。x y yÿXÿÿ
Greenparker

1
Greenparker,但是是否有这种说法的正式证据,即仅考虑从关节中抽取的样本中的一部分给出了来自边际的样本?
一位老人在海里。

通过采样(X,Y)并取X来对“ X =母亲”进行采样实际上会为您提供“正好有一个完全长大的女儿的母亲”的样本,这与“母亲”并不相同。但是,即使我们更改您的示例以说您对“ X =拥有一个完全长大的女儿的母亲”感兴趣,通过采样(X,Y)得出X也会基于Y的分布使您的样本倾斜。p(v )= ∑(support(U)中的u)(p(u,v)))= ∑(support(U)中的u)(p(v | u)* p(u)))=(1 / sampleSize( u))* ∑(u在sample(U))(p(v | u)))中,因为u的每个值都以概率p(u)出现在样本中-因此需要对p(v | u)取平均值抽签
radumanolescu
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.