为什么rand()^ 2的分布与rand()* rand()不同?


15

在Libre Office Calc中,该rand()函数可用,该函数从均匀分布中选择一个介于0和1之间的随机值。我对自己的机率有些不满意,所以当我看到以下行为时,我感到困惑:

A = 200x1的 rand()^2

B = 200x1的 rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

为什么是mean(A)!= 1/4


4
因为随机变量的平方的期望值不等于其期望值的平方。
Michael M

3
如果rand()像其他类似运算符一样操作,则A是相同的随机数平方,而B是两个随机数相乘。
彼得·弗洛姆

我明白。但是,如果我能看到数学说明的内容,或者链接到执行此操作的资源,那将非常有帮助。
Jefftopia

4
简化情况可能有助于您理解要点。假设Rand()被替换为Int(2*Rand()):这以相等的概率取值1。其平方有两种可能,两种(独立)值的乘积有四种可能性:当您计算出他们的期望时会发生什么?01个
Whuber

Answers:


24

考虑矩形可能会有所帮助。想象一下,您有机会免费获得土地。土地的大小将由(a)随机变量的一种实现或(b)同一随机变量的两种实现来确定。在第一种情况(a)中,面积将是一个正方形,边长等于采样值。在第二种情况(b)中,两个采样值将代表矩形的宽度和长度。您选择哪一种?

为正随机变量的实现。ü

a)一个实现的期望值确定等于U 2的平方面积。平均而言,该区域的大小为 E [ U 2 ]üü2

Ë[ü2]

b)中如果有两个独立的实现ü 2,该区将ù 1ü 2。平均来说,该尺寸等于 ë [ ù 1Ù 2 ] = ë 2 [ ù ] 因为两者实现是从相同的分布和独立的。ü1个ü2ü1个ü2

Ë[ü1个ü2]=Ë2[ü]

当我们计算区域a)和b)的大小之差时,我们得到

Ë[ü2]-Ë2[ü]

上项与相同,后者固有地大于或等于0V一种[R[ü]0

这适用于一般情况。

在示例中,从均匀分布采样。因此,ü01个

E2[U]=1

Ë[ü]=1个2
Var[U]=1
E2[U]=14
Var[U]=112

E[U2]=Var[U]+E2[U]

E[U2]=112+14=13

这些值是通过分析得出的,但它们与您使用随机数生成器获得的值匹配。


aba2+ab+b23

这是方差的巧妙用法。在这里,我将直接进行数学运算。
Affine

这对我来说很有意义。这一切都取决于方差是非负的。我也对约翰如何得到答案感到好奇。
Jefftopia

基本上只是遵循Sven的所作所为,但是用公式代替了它们,以获得更通用的均匀分布。
约翰

E[U2]E[U2]E[U2]E2[U]

10

并不建议Sven的出色回答中缺少任何内容,但我想提出一个相对简单的问题。

考虑绘制每个产品的两个组成部分,以查看联合分布非常不同。

plot of u1 vs u2 and u1 vs u1

请注意,当两个分量都较大时,乘积往往只会变大(接近1),而当两个分量完全相关而不是独立时,则更容易发生。

1ϵϵϵ/2U2U1×U2ϵ2/2

完全不同!

这可能有助于在上面的图形上绘制等积轮廓-即对于xy =恒定的曲线,其值分别为0.5、0.6、0.7、0.8、0.9。当您使用越来越大的值时,对于独立情况,轮廓上方和右侧的点比例下降得更快。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.