均匀分布的数字之间的差异是否均匀分布?


22

我们多次滚动6面模具。

计算一卷与其前一卷之间的差异(绝对值),期望差异是否均匀分布?

为了说明10卷:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

这些diff值会均匀分布吗?


13
绘制直方图至少可以让人感觉到
冈斯

2
查看Poisson分布
大约在

这看起来像功课....
马努^ h

@Manu H,我向你保证做作业的日子我身后的方式
HeyJude

Answers:


37

不,它不统一

您可以计算出36绝对差异的可能性

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

给出了绝对差的概率分布

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas该答案中的表格显然与您的主张相矛盾:例如,它表明,可能的差异中只有一个是5,而其中的6是0。由于所有36个可能性都是相同的,因此是不一致的。

13
@onurcanbektas,我再次邀请您考虑桌子。由于它只有两个绝对差5,难道不是只有两个绝对差等于5吗?

14
@onurcanbektas对于简单的差异(即带符号,因此从-5到+5的整数),分布是对称离散三角分布,其众数(最可能的值)为0。对于绝对差异,如我的答案所示,模式1
亨利

2
但是,可能值得注意的是,有符号差模6是均匀分布的。
Federico Poloni

2
@FedericoPoloni这不是很明显吗?我的意思是,在阅读评论之前,我从来没有真正了解过它,但是很明显,这确实是必须的
Cruncher

21

仅使用有关概率和实数的最基本公理,就可以证明一种更强有力的陈述:

任何两个独立的,均匀分布的非恒定随机值XY 永远不会具有离散的均匀分布。

(连续变量的类似陈述已在Uniform PDF中证明了两个rv的差。)

这个想法是,XY为极值的机会必须小于XY为零的机会,因为只有一种方法(例如)使XY最大化,而有许多方法可以使差为零。 ,因为XY具有相同的分布,因此可以彼此相等。这是详细信息。

首先观察到,假设的两个变量XY只能以有限的概率获得n个具有正概率的值,因为将至少存在n不同的差异,并且均匀分布将它们分配为均等的概率。如果n是无限的,那么具有正等概率的可能差异的数目也将是无限的,因此它们的机会之和将是无限的,这是不可能的。

其次,由于差异的数量是有限的,因此差异最大。最大差异只能减去的最小的值时可以实现Y --let称之为m,并假设它具有概率q=Pr(Y=m) --from的最大值X --let的呼叫的一个Mp=Pr(X=M). 因为XY是独立的,所以发生这种差异的机会就是这些机会的乘积,

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

最后,由于XY具有相同的分布,因此有很多方法可以使它们的差产生值0. 在这些方法中,有X=Y=mX=Y=M. 由于此分布是非恒定的,因此mM.不同这表明这两种情况都是不相交的事件,因此,他们必须贡献至少p2+q2的机会,XY为零;那是,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

由于数字的方块不在负,0(pq)2,从那里我们从推断()的是

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

表示XY的分布不均匀,即QED。

编辑以回应评论

绝对差异的相似分析|XY|注意到,因为XY具有相同的分布,m=M.这要求我们研究Pr(XY=|Mm|)=2pq.相同的代数技术产生几乎相同的结果,但是有可能2pq=2pq+(pq)22pq+p2+q2=1.即方程系统具有唯一解p=q=1/2对应于一个公平的硬币(一个“双面模”)。除此例外之外,绝对差的结果与差的结果相同,并且由于已经给出的相同的基本原因:即,当存在两个以上不同的差时,两个iid随机变量的绝对差不能均匀分布很有可能。

(编辑结束)


让我们将此结果应用于这个问题,该问题询问一些更复杂的问题。

模型中的管芯的每一个独立辊(这可能是一个不公平的与随机变量模)Xi, i=1,2,,n. 在这些观察到的差异n辊是数字ΔXi=Xi+1Xi. 我们可能想知道这些n1个数是如何均匀分布的。这的确是一个关于统计预期的问题:什么是预期数量ΔXi例如等于零?什么是预期数量ΔXi等于1等等

这个问题的问题的方面是,ΔXi独立的:例如,ΔX1=X2X1ΔX2=X3X2涉及相同的辊X2.

但是,这并不是真正的困难。由于统计期望是添加剂和所有差异具有相同的分布,如果我们挑选任何可能的值k的差异,期望次数的差等于k的整个序列中n辊只是n1倍的预期数在该过程的单个步骤中,乘积之差等于k。该单步的期望是Pr(ΔXi=k)(对于任何i)。这些预期将是所有相同k(即统一)当且仅当它们是用于单个相同ΔXi. 但是,我们已经看到,没有ΔXi有一个均匀分布,即使在芯片可能有偏差。 因此,即使在期望频率的这种较弱的意义上,辊的差异也不均匀。


@Michael Good point:我回答的问题是按询问的(关于“差异”),而不是图示的(显然是指绝对差异)。应用相同的技术-只需考虑最大和最小差异即可。在这些是仅有的两种可能性(具有零沿)的情况下,我们可以得到平等,这是在伯努利结果来自(示出它的独特的这样的例子)。(1/2)

另一个证明此问题的特定版本的答案在这里
恢复莫妮卡

谢谢,@ Ben:我忘记了那个话题。因为它是更好的参考,所以我现在在此答案中直接链接到它。
ub

12

从直觉上讲,只有在所有随机事件的可能性均相同的情况下,随机事件才能均匀分布。

对于所讨论的随机事件是否是如此-两个骰子掷骰之间的绝对差?

在这种情况下,只需看极端即可—这种差异可能取最大和最小的值是多少?

显然0是最小的(我们正在研究绝对差异,并且掷骰子可以相同),而5是最大的(6vs 1)。

我们可以通过显示事件0发生的可能性更大(或更少),从而表明事件是不一致的5

乍一看,只有5种发生的方式是两种-如果第一个骰子是6个,第二个骰子是1个,或者 反之亦然。0可以通过几种方式发生?


1
+1我认为这很重要。我发布了对该问题的概括,该问题最终依赖于相同的观察结果。

5

如亨利所言,均匀分布的差异不是均匀分布的。

为了用模拟数据说明这一点,我们可以使用一个非常简单的R脚本:

barplot(table(sample(x=1:6, size=10000, replace=T)))

enter image description here

我们看到这确实产生了均匀的分布。现在,让我们看一下来自该分布的两个随机样本的绝对差的分布。

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

enter image description here


6
为什么这与CLT有关,CLT与大量iid值的均值的渐近分布有关?

2
nnn>1n=2n=2n=4n
krubo

3
@Krubo最初的问题是询问模具连续几卷之间的差异分布。CLT对此无话可说。的确,无论骰子被滚动多少次,这些差异的分布都不会接近常态。
ub

模具表面的数量趋于无穷大时,这种分布是否趋于均匀?不确定如何显示它,但是直觉上感觉像朝那个方向前进,但是我不知道它是否
Cruncher

@Cruncher,您可以轻松地在R代码中更改模具面的数量。面孔越多,分布的阶梯性质越明显。“ 1”始终是该楼梯的峰值,并且差异较大时,概率接近零。另外,“ 0”之差明显比“ 1”少。(至少如果骰子的最小值为'1')
LuckyPal

2

其他人已经进行了计算,我会给您一个对我来说似乎更直观的答案。您想研究rv(Z = X +(-Y))的两个uni之和,整体分布是(离散)卷积积:

P(Z=z)=k=P(X=k)P(Y=zk)

zkz

通过信号处理,我们知道卷积积如何表现:

  • 两个统一函数(两个矩形)的卷积积将给出一个三角形。维基百科对连续功能进行了说明:

enter image description here

  • zz

  • 一般而言,我们知道,通过卷积稳定的唯一函数是高斯家族的函数。即通过加法(或更一般而言,线性组合),只有高斯分布是稳定的。这也意味着在组合均匀分布时不会获得均匀分布。

至于为什么得到这些结果,答案在于这些函数的傅里叶分解。卷积积的傅里叶变换是每个函数的傅里叶变换的简单积。这给出了矩形函数和三角形函数的傅里叶系数之间的直接链接。


请检查您的声明的有效性和答案的逻辑。问题不是两个均匀分布的卷积是否一致:而是某个分布的卷积及其逆转是否可以一致。而且在卷积下(当然是模数标准化),比高斯稳定的分布族要多得多:请参阅en.wikipedia.org/wiki/Stable_distribution
whuber

您对稳定的分布是正确的。对于这个问题,我很确定这与两个具有均匀分布的随机值之差有关(如标题所示)。一些分布的卷积及其反转是否可以统一的问题比这里要问的要大。
lcrmorin

1

xy|xy|=kk=0,1,2,3,4,5k

consecutive dice rolls difference visualization

如您所见,每种颜色的点数是不一样的。因此,差异不是均匀分布的。


0

dŤ 表示差异和 X 胶卷的价值,然后 PdŤ=5=PXŤ=6XŤ-1个=1个<PXŤXŤ-1个{6352}<PdŤ=3

所以功能 PdŤ=d 在...中不是恒定的 d。这意味着分布不均匀。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.