的分布是什么


17

我有四个独立的均匀分布的变量a,b,c,d中,每个在 [0,1]。我想计算(ad)2+4bc。我计算的分布u2=4bc是(因此),并且的等于

f2(u2)=14lnu24
u2(0,4]u1=(ad)2
f1(u1)=1u1u1.
现在,总和的分布为(也独立)因为。这里必须是因此积分等于现在我将其插入Mathematica并得到u1+u2u1,u2
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
y(0,4]x>y
fu1+u2(x)=140x1xyxylny4dy.
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

我制作了四个独立的集合,每个集合分别由数字组成,并绘制了的直方图:a,b,c,d106(ad)2+4bc

在此处输入图片说明

并绘制了:fu1+u2(x)

在此处输入图片说明

通常,该图与直方图相似,但在区间大部分为负(根在​​2.27034处)。正部分的积分。(0,5)0.77

哪里错了?或者我在哪里缺少什么?

编辑:我缩放直方图以显示PDF。

在此处输入图片说明

编辑2:我想我知道推理的问题所在-集成限制。因为和,所以我不能简单地。该图显示了我必须集成的区域:y(0,4]xy(0,1]0x

在此处输入图片说明

这意味着我有为(这就是为什么我的一部分是正确的),中和 in。不幸的是,Mathematica无法计算后两个积分(嗯,它的确计算了第二个积分,因为输出中有一个虚构的单位会破坏一切... )。 Ý 0 1 ] ˚F X X - 1个 Ÿ 1 4 ] 4 X - 1 Ÿ 4 5 ]0xy(0,1]fx1xy(1,4]x14y(4,5]

编辑3:看来Mathematica可以使用以下代码计算最后三个积分:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

这给出了正确的答案:)


2
我喜欢您尝试通过模拟检查答案的合理性。您的问题是您知道自己犯了一个错误,但是看不到哪里。您是否考虑过可以检查方法的每个阶段,以解决错误所在?例如,错误是否出在您的?好了,您可以像模拟最终结果一样对照模拟结果检查计算出的PDF。与f 2同上。如果f 1f 2都正确,则在组合它们时会出错。通过这种逐步检查,您可以查明哪里出了问题!f1(u1)f2f1f2
银鱼

我放弃了第一次尝试,并从头开始重新计算。我相信f 2是正确的,尽管我必须手动将初始f 1乘以2才能将其归一化为单位。但这只是改变高度,并不能解释为什么我有负ff1f2f1f
corey979

当生成此类直方图以与计算的代数量进行比较时,将直方图缩放为有效密度(如果可以的话,将其叠加)。对f1和f2做类似的检查,以确保您拥有正确的权限;如果它们是正确的(我还没有找到怀疑它们的充分理由,但是最好再三检查),那么问题必须在以后。
Glen_b-恢复莫妮卡2015年

Answers:


19

通常,它有助于使用累积分布函数。

第一,

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

下一个,

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

介于a - d 2 + 4 b c的最小(0)和最大(5)可能值之间。写入X = - d 2与CDF ˚Fÿ = 4 b Ç与PDF = g ^ ',我们需要计算δ05(ad)2+4bcx=(ad)2Fy=4bcg=G

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

我们可以预料这很讨厌- 均匀分布的PDF不连续,因此应该在的定义上产生破绽-因此Mathematica获得封闭形式(在此我不再赘述)有点令人惊讶。相对于δ求差得到所需的密度。在三个间隔内分段定义。在0 < δ < 1Hδ0<δ<1

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

1<δ<4

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

并且在4<δ<5

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

Figure

该图将的曲线图覆盖在a - d 2 + 4 b c10 6个 iid实现的直方图中。两者几乎无法区分,这表明h公式的正确性。h106(ad)2+4bch


以下是几乎没有头脑的,蛮力的Mathematica解决方案。它几乎可以自动执行有关计算的所有操作。例如,它甚至可以计算结果变量的范围:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

这就是所有的整合和差异化。(请耐心;计算需要花费几分钟。)H

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

最后,模拟并与的图进行比较:h

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

8
(+1),特别是要提醒人们,与其说密度卷积,不如说是“通常有助于使用累积分布函数”,尤其是当它们具有这种简单形式时。而且,你也该死的。
Alecos Papadopoulos

在我了解之后,这看起来就像是我乐意接受的简洁解决方案。我更是一个微积分的人,而不是概率论的人。目前,我有三个问题:i)您如何使用CDF来获得G y ,ii)为什么H的积分下有Fg,以及iii)您如何从其形式获得解决方案的结果将是分段的吗?F(x)G(y)FgH
corey979

FG

7

像OP和麻烦一样,我将使用独立性将其分解为更简单的问题:

X=(ad)2Xf(x)

enter image description here

Y=4bcYg(y)

enter image description here

X+YTransformSum

TransformSum[{f,g}, z]

which returns the pdf of Z=X+Y as the piecewise function:

enter image description here

Here is a plot of the pdf just derived, say h(z):

enter image description here

Quick Monte Carlo check

The following diagram compares an empirical Monte Carlo approximation of the pdf (squiggly blue) to the theoretical pdf derived above (red dashed). Looks fine.

enter image description here

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.