谁能澄清“随机变量和”的概念


21

在我的概率类别中,经常使用术语“随机变量的总和”。但是,我坚持到底是什么意思?

我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那不就是一个数字吗?随机变量实现的总和如何导致我们产生分布或任何种类的cdf / pdf /功能?如果不是随机变量实现,那么到底要添加什么呢?


1
通过“随机变量的实现”,我假设您是指实际的观测值。“随机变量总和”的总和是在观察随机变量之前。想象一下,计算接下来要坐上电梯的5个人的重量。您还不知道它们的权重,因此它们都是随机变量。但是您可能想知道一些关于权重之和的分布的信息。
PeterR 2014年

@PeterR这是我不明白的。谈论添加尚无价值的东西甚至有什么意义?它是隐喻的求和类型吗?
2014年

1
我认为您的问题是您不了解什么是随机变量。如果您有了这个概念,那么总和也将很容易获得。
阿克萨卡(Aksakal)

@Aksakal我已经发布了这个问题的证据了吗?也许,如果您知道的话,您可以澄清一下这个概念吗?
2014年

给出了很好的答案。另一个很好的例子是两个骰子的总和。结果显然是随机的(您事先不知道两个骰子的总和是多少)。我们知道,X ÿ ü Ñ ˚F 1 6 和独立的。事实证明具有三角形分布。X+YX,YUnif(1,6)X+Y
bdeonovic 2014年

Answers:


39

物理,直观的随机变量模型是在一张或多张纸条(“票”)上写下人口中每个成员的姓名,然后将这些票放入盒子中。彻底混合盒子中的内容,然后盲目地抽出一张票(就像在彩票中一样)的过程,将模拟随机性。通过在框中引入可变数量的票证来建模非统一概率:更多票证用于更有可能的成员,更少的票证则用于不太可能的成员。

随机变量是与所述群体的每个成员相关联的号码。(因此,为了保持一致,给定成员的每张票证都必须写有相同的数字。)通过在票证上保留多个空格来模拟多个随机变量。我们通常给予那些空间的名称,如ÿ ž。该总和的随机变量是通常的总和:保留一个新的空间,每票的总和,读出的值X ÿ 每个票,写他们的总和的新空间。这是在票证上写数字的一致方式,因此这是另一个随机变量。X, Y,ZX, Y,

数字

该图描绘了一个表示总体和三个随机变量XYX + Y的框。它包含六张票证:α的三张票(蓝色)的概率为3 / 6β的三张票(黄色)的概率为2 / 6γ的一张票(绿色的)概率为3/6。1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6。为了显示票证上写的内容,在混合之前先显示票证。

这种方法的优点在于,该问题的所有矛盾之处都是正确的:

  • 随机变量的总和确实是一个确定的数字(针对总体中的每个成员),

  • 但它也会导致分布(由总和出现在框中的频率决定),并且

  • 它仍然有效地模拟了随机过程(因为票证仍然是从盒子中盲目抽出的)。

以这种方式,总和可以同时具有一个确定的值(由应用于每张票证上的数字的加法规则确定),而实现(将是从盒子中抽取的票证)在此之前没有值。它被执行。

在理论文献中采用了这种从盒子中抽奖券的物理模型,并严格定义了样本空间(总体),sigma代数(及其相关的概率度量)和随机变量的定义,作为样本空间上定义的可测量函数。

实际意义是什么?”中详细阐述了有关随机变量的说明,并附有实际示例


3
+1个示例性帖子。希望您不要介意这个紧迫的问题,但是插图是怎么做的呢?
Glen_b-恢复莫妮卡2014年

4
@Glen_b PowerPoint :-)。盒子的图片来自mymiddlec.files.wordpress.com/2013/09/empty-box.jpg。票证是PowerPoint图形。(这些问题没什么大不了的!)我将整个文件分组,将其粘贴到Paint中,然后将其保存为.png文件。

我丢失了一些东西,但似乎您只是在人口的每个成员上写了多个数字标签。所有阿尔法有X = 1,Y = 2,并因此X + Y = 3。X,Y和X + Y具有完全相同的分布,移位的值这里的值存在,因为不同lebels的
MiloMinderbinder

1
@whuber-应该有书面频率。不太精通数学术语,说“潜在概率测度”。无论如何,你正在让我流连忘返。我开始看到我如何才能使用票上的数字给它期望的概率分布。从粗略的角度看,这种方法似乎只是一个带有不同“标签”的文字游戏,因此并没有清楚地看到它。就像您是第50次在此网站上为我提供帮助一样。谢谢
MiloMinderbinder

1
@Milo不客气。现在,我看到您对这个答案中的示例做出了反应,而不是我在前面的评论中给出的示例。答案的示例确实有三个不同的票证,它们的相对频率为1:2:3,在这种情况下,这就是“概率测度”的全部含义。但是,这不仅行话:对基础概念有深刻的需求。见,除其他外, stats.stackexchange.com/questions/199280一些不错账户。

4

这句话背后没有秘密,这很简单,就像您想的那样:如果X和Y是两个随机变量,则它们的和为X + Y,并且这个和也是一个随机变量。如果X_1,X_2,X_3,...,X_n是n个随机变量,则它们的总和为X_1 + X_2 + X_3 + ... + X_n,并且该总和也是随机变量(并且该总和的实现是单个数,即n个实现的总和)。

为什么在课堂上这么多谈论随机变量的总和?一个原因是(惊人的)中心极限定理:如果我们对许多独立的随机变量求和,那么我们可以(几乎)“预测”该和的分布,而与总和中的单个变量的分布无关!总和趋于成为正态分布,这就是为什么我们在现实世界中如此频繁地观察到正态分布的可能原因。


3

rv是事件的发生与实数之间的关系。说,如果正在下雨,则X的值为1,如果不为0,那么您可以将另一个rv Y设置为冷时等于10,热时等于100。因此,如果下雨和寒冷,则X = 1,Y = 10和X + Y = 11。

X + Y值为10(不冒雨);11(下雨,寒冷),100(不下雨,高温)和110(下雨,高温)。如果您计算出事件发生的概率,那么您将获得此新rv X + Y的PMF。


1

这些答案都没有给出数学上严谨的方式来考虑随机变量之和。注意X,YX+YΩ1×Ω2X,YΩ={Head,Tail}X(Head)=Y(Head)=1,X(Tail)=Y(Tail)=0(X+Y)X,YσX,Y

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.