在我的概率类别中,经常使用术语“随机变量的总和”。但是,我坚持到底是什么意思?
我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那不就是一个数字吗?随机变量实现的总和如何导致我们产生分布或任何种类的cdf / pdf /功能?如果不是随机变量实现,那么到底要添加什么呢?
在我的概率类别中,经常使用术语“随机变量的总和”。但是,我坚持到底是什么意思?
我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那不就是一个数字吗?随机变量实现的总和如何导致我们产生分布或任何种类的cdf / pdf /功能?如果不是随机变量实现,那么到底要添加什么呢?
Answers:
物理,直观的随机变量模型是在一张或多张纸条(“票”)上写下人口中每个成员的姓名,然后将这些票放入盒子中。彻底混合盒子中的内容,然后盲目地抽出一张票(就像在彩票中一样)的过程,将模拟随机性。通过在框中引入可变数量的票证来建模非统一概率:更多票证用于更有可能的成员,更少的票证则用于不太可能的成员。
甲随机变量是与所述群体的每个成员相关联的号码。(因此,为了保持一致,给定成员的每张票证都必须写有相同的数字。)通过在票证上保留多个空格来模拟多个随机变量。我们通常给予那些空间的名称,如ÿ ,和ž。该总和的随机变量是通常的总和:保留一个新的空间,每票的总和,读出的值X ,ÿ ,等每个票,写他们的总和的新空间。这是在票证上写数字的一致方式,因此这是另一个随机变量。
该图描绘了一个表示总体和三个随机变量X,Y和X + Y的框。它包含六张票证:α的三张票(蓝色)的概率为3 / 6,β的三张票(黄色)的概率为2 / 6,γ的一张票(绿色的)概率为3/6。1 / 6。为了显示票证上写的内容,在混合之前先显示票证。
这种方法的优点在于,该问题的所有矛盾之处都是正确的:
随机变量的总和确实是一个确定的数字(针对总体中的每个成员),
但它也会导致分布(由总和出现在框中的频率决定),并且
它仍然有效地模拟了随机过程(因为票证仍然是从盒子中盲目抽出的)。
以这种方式,总和可以同时具有一个确定的值(由应用于每张票证上的数字的加法规则确定),而实现(将是从盒子中抽取的票证)在此之前没有值。它被执行。
在理论文献中采用了这种从盒子中抽奖券的物理模型,并严格定义了样本空间(总体),sigma代数(及其相关的概率度量)和随机变量的定义,作为样本空间上定义的可测量函数。
这句话背后没有秘密,这很简单,就像您想的那样:如果X和Y是两个随机变量,则它们的和为X + Y,并且这个和也是一个随机变量。如果X_1,X_2,X_3,...,X_n是n个随机变量,则它们的总和为X_1 + X_2 + X_3 + ... + X_n,并且该总和也是随机变量(并且该总和的实现是单个数,即n个实现的总和)。
为什么在课堂上这么多谈论随机变量的总和?一个原因是(惊人的)中心极限定理:如果我们对许多独立的随机变量求和,那么我们可以(几乎)“预测”该和的分布,而与总和中的单个变量的分布无关!总和趋于成为正态分布,这就是为什么我们在现实世界中如此频繁地观察到正态分布的可能原因。