构造一个离散的rv,以支持所有原理


19

这是这个问题的建构主义后遗症。

如果我们不能有一个离散的统一随机变量来支持区间中的所有有理数,那么下一个最好的事情就是: [0,1]

构造一个具有此支持的随机变量,,并遵循一定的分布。我的工匠要求此随机变量是根据现有分布构建的,而不是通过抽象定义我们想要获得的内容来创建的。Q Q[ 0 1 ]QQQ[0,1]

因此,我提出了以下建议:

令为遵循参数的Geometric Distribution-Variant II的离散随机变量,即0 < p < 1X0<p<1

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

还令为遵循相同参数的几何分布-变量I的离散随机变量,即pYp

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

X和是独立的。现在定义随机变量Y

Q=XY

并考虑条件分布

P(Qq{XY})

用宽松的话说:“条件是与Y之比,条件是X小于或等于Y。 ” 此条件分布的支持为\ {0,1,1 / 2,1 / 3,...,1 / k,1 /(k + 1),...,2 / 3,2 / 4 ,. .. \} = \ mathbb {Q} \ cap [0,1]X ÿ X ÿ { 0 1 1 / 2 1 / 3 1 / ķ 1 /ķ + 1 2 / 3 2 / 4 } = Q[ 0 1 ]QXYXY{0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1]

“问题”是:有人可以提供相关的条件概率质量函数吗?

有评论问“应该是封闭形式”吗?由于如今构成封闭形式的内容还不是很清楚,让我这样说:我们正在寻找一种函数形式,可以从输入有理数,并获得概率(对于某些形式(当然是参数的指定值),从而得出pmf 的指示。然后改变以查看图形如何变化。p[0,1]pp

如果有帮助,那么我们可以打开支撑的一个或两个边界,尽管这些变体将使我们无法明确绘制pmf的上限值和/或下限值。另外,如果我们打开上限,则应考虑条件事件。{X<Y}

另外,我也欢迎具有此支持的其他rv,只要它们与pmf在一起即可

我之所以使用“几何分布”,是因为它具有两个可用的变体,一个变体在支撑中不包括零(因此避免了被零除)。显然,可以通过截断使用其他离散的rv。

我最肯定会在这个问题上悬赏,但是系统不允许立即这样做。


1
您是说吗?(东西conditionnally定义一个随机变量,是没有意义的,你只能定义它以这种方式分布)Q=XY1{XY}
斯特凡纳·洛朗

1
您的Q是可数的:您知道N = {1,2,...}与Q之间存在1-1对应。如果可以找到这样的对应,则解决方案是选择N上的任何分布并使用它选择Q的相应元素。–
Adrian

无论如何,您必须为每个不可约分数计算,这是。p / q Pr X = p X = 2 p × Pr Y = q Y = 2 q Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
斯特凡洛朗

1
提供pmf的要求是否意味着需要封闭格式?还是@StéphaneLaurent的无穷大足以满足条件?
Juho Kokkala 2014年

1
令,Y为帖子中的RV。P - [R [ Q = q ] = P [R [ ý = ˚F - 1q ]f:NQ[0,1]Pr[Q=q]=Pr[Y=f1(q)]
Adrian

Answers:


19

考虑离散分布,它支持具有概率质量的集合{ p q F{(p,q)|qp1}N2

F(p,q)=321+p+q.

可以很容易地将其求和(涉及的所有序列都是几何的)以证明它确实是分布(总概率为1)。

对于任何非零有理数让为其最低表示:即和。a / b = x b > 0 gcd xa/b=xb>0gcd(a,b)=1

F通过规则在上引起离散分布[ 0 G[0,1]Q

G(x)=G(ab)=n=1F(an,bn)=321+a+b2.

(并且)。 每个有理数均具有非零概率(如果必须在具有正概率的值中包括,则只需从另一个数(例如减去一些概率,然后将其分配给0即可。)G(0)=00 1(0,1]010

要了解这种构造,请看一下对描述:F

[F的身影]

给出具有正积分坐标的所有点 p q的概率质量。F的值由圆形符号的彩色区域表示。对于图中出现的坐标 p q的所有可能组合,直线的斜率为 p / q。它们以与圆形符号相同的方式着色:根据其斜率。因此,斜率(其清楚地范围从 0 1)和彩色对应于参数 ģ和的值 G ^Fp,qFp/qpq01GG通过将每条线上的所有圆的面积相加得出。例如,通过沿倾斜的主对角线的所有(红色)圆的面积求和而获得1,由下式给出˚F 1 1 + ˚F 2 2 + ˚F 3 3 + = 3 / 8 + 3 / 32 + 3 / 128个+ = 1 /G(1)1F(1,1)+F(2,2)+F(3,3)+3/8+3/32+3/128+=1/2

数字

该图所示的近似实现通过限制q 100:它在其绘制值3044个有理数范围从1 / 1001。最大概率质量为1Gq10030441/100112,314,110,362,362,142,

这是的完整CDF (精确到图像的分辨率)。刚列出的六个数字给出了可见跳转的大小,但CDF的每个部分均包含跳转,无一例外:G

图2


1
谢谢!我正在了解施工过程。仅两个问题:a)是双变量的,但是在将其链接到G的表达式中,它看起来是单变量的。我想念什么吗?b)由于G是单变量的,所以我猜第一张令人印象深刻的图形中的所有点在水平轴上都代表一个不同的值(尽管当然不能以这样的比例来忠实地表示),对吗?FGG
Alecos Papadopoulos

我刚刚完成了一个可以解决您的评论的图形Alecos,并将其添加到了答案中。注意,我本来可以从任何离散分布开始,然后以相同的方式构造G。选择该特定分布以简化计算。FG
ub

越来越好,至于我在前面的评论中的第一个问题,应该是代替FaF(ab,n)?即p=a/bq=nF(abn)p=a/bq=n
Alecos Papadopoulos 2014年

这是比我更好的答案!我注意到了两件事:我认为您的F(p,q)等于4。同样在下面的方程式“ F产生离散分布G”中,您应该有F(na,nb)否?
阿德里安

@Adrian,Alecos感谢您捕捉这些错别字:应该是1,而F的符号显然是不正确的。我会马上修复它们。11F
ub

8

为了清楚起见,我将我的评论汇总在一起并发布为答案。我希望您不会很满意,但是,我要做的只是将您的问题归结为另一个问题。

我的记法:

是一个RV他们的支持是 Q[ 0 1 ] -我的 Q一样的 Q从他的OP结构 XQQ[0,1]QQ。我们将使用Yf定义此Q,我在下面介绍。XYQYf

任何RV他们的支持是 ň{ 1 2 ... } -在 Ÿ由OP给予一定的作用,例如。YN{1,2,}Y

是任何一对一对应 ˚F ÑQ[ 0 1 ] ˚F - 1是它的逆矩阵。我们知道这些存在。ff:NQ[0,1]f1

现在我声称我可以将您的问题简化为仅找到一个及其f 1ff1

只要让可以了。的PMF Q[ Q = q ] = [ ý = ˚F - 1q ]Q=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

编辑:

这是一个函数g,它扮演的角色,尽管不是一对一的对应关系(由于重复):f

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}

N{1,2,}ff1
Alecos Papadopoulos 2014年

f1

在您提供的链接中,它有时会说:“请注意,不必找到对应关系的公式;仅需确定存在这种对应关系即可。数学中还有许多其他实例,例如: -重点是表明必须发生某种事情或存在某种东西,而不是实际展示一个公式。” 好吧,我的问题的重点是实际展示一个公式:出于某种原因,我称此问题为“建构主义者”。
Alecos Papadopoulos 2014年

1
我想我可以提供一种行之有效的算法-我会再考虑一下。
阿德里安

我发布了一些内容-可让您模拟Q,但不能解决PMF问题。
阿德里安
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.