对两个正态分布随机变量之和的贡献的直观解释


16

如果我有两个正态分布的独立随机变量和,均值和,标准差为和并且发现,则条件分布(假设我没有犯任何错误)给定的和正态分布也以均值 和标准差 XYμXμYσXσYX+Y=cXYc

μX|c=μX+(cμXμY)σX2σX2+σY2
σX| Ç=σÿ| c=
μY|c=μY+(cμXμY)σY2σX2+σY2
σX|c=σY|c=σX2σY2σX2+σY2.

条件标准偏差与给定相同是不足为奇的,如果一个上升,另一个必须下降相同的量。有趣的是,条件标准偏差不取决于。çcc

我无法确定的是条件均值,即它们按照与原始方差成比例而不是与原始标准差成比例的方式来分配超出部分(c-\ mu_X-\ mu_Y)(cμXμY)

例如,如果它们的均值为零,μX=μY=0,并且标准差σX=3\ sigma_Y = 1则以c = 4为σY=1条件,我们将得到E [X | c = 4] = 3.6E [Y | c = 4] = 0.4,即比例为9:1,即使我凭直觉认为比例3:1更自然。 谁能对此给出直观的解释?c=4E[X|c=4]=3.6E[Y|c=4]=0.49:13:1

这是由Math.SE问题引起的

Answers:


16

通过查看和,问题很容易地的。X - μ X ý - μ ÿμX=μY=0XμXYμY

显然,条件分布是正态的。因此,每个的均值,中位数和众数是一致的。这些模式将出现在和的双变量PDF的局部最大值的坐标处,该局部最大值被约束为曲线。这意味着在该位置的双变量PDF轮廓和约束曲线具有平行切线。(这是拉格朗日乘数的理论。)因为任何轮廓的等式都具有以下形式:对于某个常数(也就是说,所有轮廓都是椭圆),它们的梯度必须平行,因此存在使得XYg(x,y)=x+y=cf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2,yσY2)=f(x,y)=λg(x,y)=λ(1,1).

在此处输入图片说明

紧随其后的是,条件分布的模式(以及均值)由方差比而不是SD决定。

该分析也适用于相关的和,并且适用于任何线性约束,而不仅仅是总和。XY


这是非常令人印象深刻的,而且比我要求的要完善。我会对图表和一条声明感到满意,即与椭圆的切线不通过椭圆的中心,因此切线红点必须与具有较高标准偏差的随机变量不成比例地增加。
亨利

1
措辞不好。我的意思是从中心到红点的线不垂直于切线。
亨利
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.