为什么两个随机变量之和是卷积?


33

长期以来,我不明白为什么两个随机变量的“和”是它们的卷积,而和的混合密度函数之和是f(x)g(x)pf(x)+(1p)g(x); 算术和而不是它们的卷积。确切的短语“两个随机变量的总和”在Google中出现了146,000次,并且如下所示是椭圆形的。如果认为RV产生单个值,则可以将该单个值添加到另一个RV单个值,这与卷积无关,至少不是直接相关,所有都是两个数字的和。但是,统计数据中的RV结果是值的集合,因此更精确的短语类似于“来自两个RV的相关个体值对的协调总和的集合是它们的离散卷积”……并且可以通过以下方式近似:对应于那些RV的密度函数的卷积。更简单的语言: 2个RVn样本实际上是两个n维向量,它们相加作为向量和。

请详细说明两个随机变量的和如何是卷积和。


6
我真的不相信抽象代数意义上的“和” 。当我们做一个“变量和”时,我们会在添加自然数或实数时引用已知的典型算术运算。这意味着我们通过将其他变量“相加”来创建新变量。“变量总和”的概念也存在于统计领域之外,并且与关于卷积和概率的表达式无关。因此,确实“变量的总和卷积”是错误的。但是没有人暗示这一点。我们应该在该声明中更改“是”一词。
Sextus Empiricus

5
这就像在争辩不应被称为“两个函数f和g的乘积”(或仅被解释为“ product”的某些抽象代数概念),因为这是一个卷积这些函数的傅立叶变换。f(x)g(x)
Sextus Empiricus

16
“通知”具有误导性。随机变量和总和具有完全相同的含义,即学童可以理解“总和”:对于每个,通过将数字加起来即可得出的值和没有什么抽象的。这些RV具有分布。存在许多表示分布的方法。的分布函数是和的DF 的卷积 ; 的特征函数是乘积XYω(X+Y)(ω)X(ω)Y(ω).X Y X + YX+YXYX+Y他们的CF; 的累积量生成函数是其CGF 的总和;等等。X+Y
ub

3
我在您的计算中看不到随机变量或分布。
ub

8
在我的岗位在语言stats.stackexchange.com/a/54894/919,一对随机变量由票对每一个箱子都写两个数字,一个指定的和其他 这些随机变量的总和是通过将每个票证上找到的两个数字相加而获得的。从字面上看,计算是您可以分配给三年级教室的一项任务。(我强调这一点既要强调操作的基本简单性,又要表明其与每个人都理解“和”的含义之间有多么紧密的联系。)(X,Y)XY.
胡伯

Answers:


14

与随机变量分布相关的卷积计算都是总概率定律的数学表示。


用我在我的帖子”中所用的语言来说,“随机变量”是什么意思?

一对随机变量包括在其上写入两个数字,一个指定的各票的一个盒子的和其他。这些随机变量的总和是通过将每个票证上找到的两个数字相加而获得的。(X,Y)XY

我在阐明随机变量之和的概念时张贴了这样一个盒子的照片及其票。

在此处输入图片说明

从字面上看,这种计算是您可以分配给三年级教室的一项任务。(我指出这一点既要强调操作的基本简单性,又要表明其与每个人理解“和”的含义之间的紧密联系。)

数学上如何表示随机变量的总和取决于您如何表示盒子的内容:

前两个是特殊的,因为该框可能没有pmf,pdf或mgf,但始终有cdf,cf和cgf。


要知道为什么卷积计算随机变量的总和的PMF或pdf适当的方法,考虑的情况下,所有三个变量和有PMF:根据定义,PMF为在任何数字表示框中的票证比例,其中之和等于写为X, Y,X+YX+YzX+Yz,Pr(X+Y=z).

根据总票证定律(不相交的子集的比例)相加,根据写在票证上的的值分解票证集,得出总和的pmf 从技术上讲,X

在盒子的不相交子集的集合中找到的票证比例是各个子集的比例之和。

因此适用:

门票的其中比例,写入必须等于总和在所有可能的值的门票,其中比例的和写入X+Y=zPr(X+Y=z),xX=xX+Y=z,Pr(X=x,X+Y=z).

因为和暗示这种表达可以直接在原始变量方面改写和作为X=xX+Y=zY=zx,XY

Pr(X+Y=z)=xPr(X=x,Y=zx).

那就是卷积。


编辑

请注意,尽管卷积与随机变量的总和相关,但是卷积不是随机变量本身的卷积!

实际上,在大多数情况下,不可能对两个随机变量进行卷积。为此,它们的域必须具有附加的数学结构。此结构是一个连续的拓扑组。

无需赘述,只需说两个函数卷积必须抽象地看起来像X,Y:GH

(XY)(g)=h,kGh+k=gX(h)Y(k).

(总和可能是一个整数,如果要从现有变量中产生新的随机变量,则无论和何时,必须是可测量的;这是必须考虑拓扑或可测量性的地方。)XYXY

此公式调用两个操作。 一个是在上的乘法将值和上相乘是有意义的 。另一种是在上的相加将元素相加必须是有意义的H:X(h)HY(k)H.G:G G.

在大多数概率应用中,是一组数字(实数或复数),乘法是通常的数字。 但是样本空间通常根本没有数学结构。 这就是为什么通常不定义随机变量的卷积的原因。该线程中卷积涉及的对象是随机变量分布的数学表示。 给定这些随机变量的联合分布,它们可用于计算随机变量总和的分布。HG,


参考文献

Stuart和Ord,肯德尔的高级统计理论,第1卷 ,1987年,第五版,第1、3和4章(频率分布,力矩和累积量以及特征函数)。


关联性与来自标量乘法代数性质涉及其 为任何真实(或络合物)数。尽管一个不错的特性是两个密度函数的卷积是一个密度函数,但不限于卷积密度函数,并且一般来说,卷积不是概率处理,当然可以,但是可以是时间序列处理,例如,在湖泊的处理水径流的降雨后,药物浓度模型以下给药等a
a(fg)=(af)g
a
卡尔

@Carl该评论与您最初的问题有关,该问题询问随机变量的总和?充其量是切线的。
ub

我要你不要过于笼统。以“卷积为”开头的句子而不说“ RV的卷积为”是椭圆形的。我这里的全部问题是椭圆符号。两个空间向量的向量加法是卷积,无论这些向量是否已归一化。如果将它们标准化,则它们不一定是概率。这就是全部事实,而不仅仅是部分事实。n
卡尔

谢谢:我将澄清第一句话,以强调我在回答您的问题。
ub

新添加的内容适用于RV的卷积,这在技术上就是我所要求的。也许我很含糊,但是卷积并不总是RV的卷积,而是可以总是将其缩减为密度函数乘以那些密度函数的某些比例因子,其中标量是可乘的,而密度函数有时是RV的,在这种情况下比例因子是乘法的身份,即,1
卡尔

41

表示法,大写和小写

https://zh.wikipedia.org/wiki/Notation_in_probability_and_statistics

  • 随机变量通常以大写罗马字母书写:,等。XY
  • 随机变量的特定实现以相应的小写字母表示。例如,,,…,可以是对应于随机变量的样本,并且将累积概率正式写为以区分随机变量与实现。x1x2xnXP(X>x)

Z=X+Y表示zi=xi+yixi,yi


变量混合-> pdf的总和

https://en.wikipedia.org/wiki/Mixture_distribution

当概率(例如Z)由不同概率的单个和定义时,可以使用概率密度函数和的总和。fX1fX2

例如,当是定义的时间的分数和定义的时间的分数时,则得到 和ZsX11sX2

P(Z=z)=sP(X1=z)+(1s)P(X2=z)
fZ(z)=sfX1(z)+(1s)fX2(z)

。。。。一个例子是在带有6面骰子或12面骰子的骰子卷之间进行选择。假设您一个骰子或另一个骰子的时间占50-50%。然后

fmixedroll(z)=0.5f6sided(z)+0.5f12sided(z)


变量总和-> pdf的卷积

https://zh.wikipedia.org/wiki/Convolution_of_probability_distributions

当概率(例如Z)由不同(独立)概率的多个和定义时,可以使用概率密度函数和的卷积。fX1fX2

例如,当(即一个和!)并且多个不同对总计为,每个对的概率为。然后得到卷积Z=X1+X2 x1,x2zfX1(x1)fX2(x2)

P(Z=z)=all pairs x1+x2=zP(X1=x1)P(X2=x2)

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)

或连续变量

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)dx1

。。。。一个示例是两个骰子的总和 for和fX2(x)=fX1(x)=1/6x{1,2,3,4,5,6}

fZ(z)=x{1,2,3,4,5,6} and zx{1,2,3,4,5,6}fX1(x)fX2(zx)

note备注我选择在进行积分和求和,我发现它更直观,但是没有必要,如果定义则可以从到进行积分。在域外。x1 domain of X1fX1(x1)=0

图片范例

导致“ pdf卷积”的“变量和”的示例

让是。要知道,你将不得不概率整合在所有的实现中那导致。ZX+YP(z12dz<Z<z+12dz)x,yz12dz<Z=X+Y<z+12dz

因此,这是沿线在区域中的积分。f(x)g(y)±12dzx+y=z


StackExchangeStrike撰写


6
@卡尔这不是行话。卷积确实可以看作是许多和的总和。但是,这不是“变量总和”的含义。它指的是诸如我们所说的“两个骰子的总和”之类的东西,在日常生活中(尤其是当我们玩棋盘游戏时)具有非常正常的意义和解释。您是否想说当我们使用两个骰子卷的代数和时,我们将两个骰子卷组合在一起?
Sextus Empiricus

2
两个骰子的(单个)总和掷出7的概率是1-6、2-5、3-4、4-3、5-2、6-1 掷出(许多)概率的总和。术语“和”出现两次,在第一种情况下,当它引用一个求和表达式时,就是“两个变量的和”的语句所指的,例如“两个骰子和”。
Sextus Empiricus

5
实际上,积分代替了概率之和。但是,这涉及术语和的第二次使用,而不是术语和的第一次使用。因此,我们仍然可以引用两个变量的总和(这是该术语的首次使用)。那是因为术语“和”不是用来指概率的卷积运算或求和运算,而是指变量的总和。
Sextus Empiricus

8
至少说“骰子总和的概率密度由各个骰子的概率密度的卷积定义”不是行话。当没有统计学家的行话时,“掷骰子总和”一词在日常生活中有非常正常的解释。在这种意义上(骰子总和),您需要解释(变量总和)。这一步也不是行话。人们一直在使用“变量总和”。只有谁认为该概率为这些款项,并开始应用卷积统计学家
塞克图斯经验派

2
@卡尔:我想你误解了我的说法。您说的是将卷积积分称为和并不好,这意味着有人称卷积积分为和。但是这里没有人在说这个。据说卷积积分是某些变量之和的pdf。您将语句更改为错误,然后抱怨它是错误的。

28

您的困惑似乎是由于将随机变量与其分布相混淆而引起的。

要“了解”这种混乱,可能需要往后退几步,让您暂时虚心一点,忘掉任何奇特的形式主义,例如概率空间和sigma代数(如果有帮助的话,假装您回到了小学)并且从未听说过这些东西!),只需考虑一下随机变量的基本含义:一个我们不确定的数值

例如,假设我手里有一个六边形的模具。(我是认真的。事实上,我对他们有整袋)。我还没有推出过,但我要的,我决定打电话,我还没有推出的数量上由模具名称“ ”。X

我可以说这是什么,没有实际摇动骰子,并确定其价值?好吧,我可以值不会是,或。实际上,我可以肯定地说它将是一个介于到之间的整数(包括和),因为这些是模具上唯一标记的数字。而且因为我是从一家信誉良好的制造商那里购买这包骰子的,所以我可以肯定的是,当我掷骰子并确定实际为多少时,它很可能是这六个可能值中的任何一个,或者与之接近我可以确定。7 1 1X71 16X1216X

换句话说,我的是一个整数值的随机变量,均匀地分布在集合。{ 1 2 3 4 5 6 }X{1,2,3,4,5,6}


好的,但是肯定所有这些都是显而易见的,那么为什么我还要继续努力研究那些肯定已经知道的琐碎事情呢?这是因为我不想再拍点,这也是微不足道的是,在同一时间,极为重要的:我可以做数学与此,即使我不知道它的价值呢!X

例如,我可以决定在要在骰子上滚动的数字上加一个,然后用“ ”来命名该数字。我不知道这个将是多少,因为在掷骰子之前我不知道是什么,但是我仍然可以说将比,或者在数学上,。QXQX Q X Q = X + 1QXQXQ=X+1

而这个会成为一个随机变量,因为我不知道它的价值还没有; 我只知道它将比。而且由于我知道可以取什么值,以及取每个值的可能性有多大,所以我也可以确定的那些值。您也可以轻松地做到这一点。您实际上不需要任何花哨的形式主义或计算就可以得出将是到之间的整数,并且(考虑到我的观点像我想的那样公平且平衡),的可能性也相同。这些值中的任何一个。QX Q Q 2 7XXQQ27

但是还有更多!我也可以决定将要在骰子上滚动的乘以3,然后将结果称为。这是另一个随机变量,我相信您也可以找出它的分布,而不必求助于任何积分或卷积或抽象代数。R = 3 XXR=3X

而且,如果我真的想要,我什至可以决定采用仍待确定的数字进行折叠,纺锤和切割,然后将其除以2,然后从中减去1,然后对结果求平方。结果数是另一个随机变量;这次,它既不是整数值也不是均匀分布的,但是您仍然可以仅使用基本逻辑和算术就可以很容易地弄清楚它的分布。S = 1XS=(12X1)2


好的,因此我可以通过将未知的模具插入各种方程式来定义新的随机变量。 所以呢? 好吧,还记得我说过我有整袋骰子吗?让我再抓一个,然后用“ ”来命名我要在骰子上滚动的号码。ÿXY

我从书包中抓取的两个骰子几乎相同-如果您在我不看时交换它们,我将无法分辨-所以我可以很安全地假定此也将与具有相同的分布。但是我真正想做的是掷骰子并计算每个骰子的总点数。这个点的总数也是一个随机变量,因为我还不知道,我将其称为“ ”。X ŤYXT

这个数字多大?那么,如果是点数我将上滚动所述第一管芯的数量,和是点子我会滚动在所述第二管芯的数量,则显然将它们的和,即,。我可以说,由于和都在1到6之间,所以必须至少为2且最多为12。而且由于和都是整数,所以显然也必须是整数。X Y T T = X + Y XTXYTT=X+YXT X Y TYTXYT


但是,取两个和十二之间的每个可能值的可能性有多大?这绝对不是同样有可能把他们每个人-一个实验位,就会发现,这是一个很大很难滚上一对骰子十二比它卷,比方说,一个七人。T

为了弄清楚这一点,我用表达式表示将数字滚动到第一个骰子(我决定将其结果称为那个骰子)上的可能性。同样,我将表示将第二个骰子上的数字滚动的可能性。当然,如果我的骰子是完全公平和平衡的,那么对于介于1到6之间的任意和,骰子实际上可能有偏差的情况,更可能掷出一些数字。X Pr [ X = a ] b Pr [ Y = b ]aXPr[X=a]bPr[Y=b] abPr[X=a]=Pr[Y=b]=16ab

现在,由于这两个模辊将是独立的(我当然不是作弊以及基于其他的!他们中的一个计划)的概率,我将推出在第一管芯在第二只会是这些概率的乘积:b Pr [ X = a  和  Y = b ]a b

Pr[X=a and Y=b]=Pr[X=a]Pr[Y=b].

(请注意,上面的公式适用于独立的随机变量对;如果将上面的替换为,则肯定不适用。)QYQ

现在,有几个可能的值和可能产生相同的总 ; 例如,从和到从和,甚至从和,也可能会出现。但是,如果我已经掷出第一个骰子,并且知道的值,那么我可以确切地说出要达到任何给定的点数,我必须在第二个骰子上掷出什么值。Y T T = 4 X = 1 Y = 3 X = 2 Y = 2XYTT=4X=1Y=3X=2Y=2Y = 1 XX=3Y=1X

具体地讲,假设我们感兴趣的概率,对于一些数量。现在,如果我滚动第一个模具后知道,那么我只能通过在第二个模具上滚动来获得总。当然,我们已经知道,在不掷骰子的情况下,在第一个骰子上滚动并在第二个骰子上滚动的先验概率为T=ccT = c Y = c a a c a Pr [ X = a  和  Y = c a ] = PrX=aT=cY=caaca

Pr[X=a and Y=ca]=Pr[X=a]Pr[Y=ca].

但是,当然,有几种方法可以使我达到相同的总,具体取决于我最终在第一个骰子上滚动的结果。为了得到总的概率滚动上的两个骰子点数,我需要添加了所有不同的方式我可以滚即总的概率。例如,我将在两个骰子上总共掷4点的总概率为:[cc Pr [ T = 4 ] = Pr [ X = 1 ] Pr [ Y = 3 ] + Pr [ X = 2 ] Pr [ Y = 2 ] + Pr [Pr[T=c]c

Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X=2]Pr[Y=2]+Pr[X=3]Pr[Y=1]+Pr[X=4]Pr[Y=0]+

请注意,我对上述总和有点过大:当然,不可能为!但是从数学上讲这没问题;我们只需要将不可能发生的事件(如(或或或))的概率定义为零。这样,我们就得到了两个模辊之和(或更一般地,任何两个独立的整数值随机变量)之和的分布的通用公式:0 Y = 0 Y =Y0Y=0Y = 1 Y = 1Y=7Y=1Y=12

T=X+YPr[T=c]=aZPr[X=a]Pr[Y=ca].

而且,我完全可以在这里停止我的论述,而无需提及“卷积”一词!但是,当然,如果您偶然知道离散卷积是什么样子,则可以在上面的公式中识别出一个。这就是说明上述得出的基本结果的一个比较先进的方法:在概率密度函数的两个整数值随机变量的总和是加数的概率密度函数的离散卷积。

当然,通过用积分和概率质量用概率密度代替和,我们也得到了连续分布随机变量的相似结果。通过充分扩展卷积的定义,我们甚至可以将其应用于所有随机变量,而不管它们的分布如何—尽管此时该公式几乎变成了重言式,因为我们几乎已经定义了两个卷积任意概率分布是具有这些分布的两个独立随机变量之和的分布。

但是即使如此,所有这些包含卷积和分布以及PMF和PDF的东西实际上只是一组用于计算有关随机变量的工具。我们正在计算事物的根本目标是随机变量自己,这真的只是数字,其值我们不知道

而且,无论如何,该卷积技巧适用于随机变量的总和。例如,如果您想知道或,则必须使用基本方法弄清楚,结果将不会是卷积。V = X YU=XYV=XY


附录:如果您想要一个用于计算总和/乘积/指数/两个随机变量的任意组合的分布的通用公式,这是一种写法: 其中代表任意二进制运算,是艾弗森括号,即

A=BCPr[A=a]=b,cPr[B=b and C=c][a=bc],
[ 一个= b Ç ] [ 一个= b Ç ] = { 1 ,如果  一个= b ç  和0[a=bc]
[a=bc]={1if a=bc, and0otherwise.

(在大多数无意义的形式主义中,将这个公式推广到非离散的随机变量是一种练习。离散的情况足以说明基本思想,非离散的情况只是增加了一些无关紧要的并发症。)

您可以检查一下自己该公式确实适用于例如加法运算,并且对于添加两个独立随机变量的特殊情况,它等效于前面给出的“卷积”公式。

当然,实际上,该通用公式对计算的用处不大,因为它涉及两个无边界变量的和而不是一个。但是与单和公式不同,它适用于两个随机变量的任意函数,甚至是不可逆的变量,并且还明确显示了运算,而不是将其伪装成其反函数(例如“卷积”公式将加法伪装为减法)。


附言 我只是掷骰子。结果表明和,这意味着,,,,和。现在你知道了。;-)Y = 6 Q = 6 R = 15 S = 2.25 T = 11 U = 30 V = 15625X=5Y=6Q=6R=15S=2.25T=11U=30V=15625


4
这应该是公认的答案!非常直观清晰!
弗拉迪斯拉夫(Vladislavs Dovgalecs)18-3-7的

3
@Carl:我想指出的一点是,和随机变量的确实是一个简单的总和:。如果我们要计算分布的,那么我们需要做一些更复杂,但是这是一个次要问题。随机变量不是其分布。(实际上,随机变量甚至没有完全以其分布为特征,因为(边际)分布本身并没有编码有关其可能与其他变量的依赖关系的信息。)TT=X+YT
Ilmari Karonen18年

3
@Carl:...无论如何,如果您想为“添加随机变量”引入特殊符号,那么为了保持一致性,您还应该为“随机变量乘法”和“随机变量除法”添加特殊符号, “随机变量的幂”和“随机变量的对数”等。所有这些操作都很好地定义在随机变量上,这些变量被视为具有不确定值的数字,但在所有情况下,计算结果的分布要比仅仅对常量进行相应的计算要复杂得多。
Ilmari Karonen

5
@卡尔:当您停止将随机变量与其分布混淆时,混乱就消失了。从任何有意义的意义上讲,获取随机变量的分布都不是线性运算,因此,两个随机变量之和的分布(通常)不是其分布之和。但是,对于任何非线性操作,情况都是如此。当然,您不会对感到困惑,所以为什么还要对感到困惑吗? Pr[X+Y=c]Pr[X=c]+Pr[Y=c]x+yx+yPr[X+Y=c]Pr[X=c]+Pr[Y=c]
Ilmari Karonen

3
@卡尔:等等,什么?我摇两个骰子,写下结果和,然后计算。那怎么不是普通的分裂?(是的,即使我在掷骰子之前这样做,仍然是普通的除法。在这种情况下,和的值尚未确定,因此的值也不固定。)ÿXYX Y ZZ=X/YXYZ
Ilmari Karonen

7

实际上,除非我误解了你,否则我认为这是不对的。

如果和是独立的随机变量,则您所指的和/卷积关系如下: 即概率密度函数(pdf)总和的等于和的各个pdf的卷积(用运算符表示)。Y p X + Y = p X * p Y * X YXY

p(X+Y)=p(X)p(Y)
XY

看这是为什么,考虑为固定值,总和如下的PDF,移位的量。因此,如果考虑所有可能值,则的分布是通过将的每个点替换为以该点为中心的的副本(反之亦然),然后对所有这些副本求和,这正是卷积。S = X + Y Y x X S p X p Y X=xS=X+YYxXSp(X)p(Y)

形式上,我们可以这样写: 或等效地: p 小号= p X小号- Ý p ÝÝ d ÿ

p(S)=pY(Sx)pX(x)dx
p(S)=pX(Sy)pY(y)dy

编辑:希望消除一些混乱,让我总结一下我在评论中说的一些话。两个随机变量和的总和不涉及其分布的总和。它是指对它们的实现进行总结的结果。要重复我的意见给了例子,假设和与两个骰子(一卷抛出的数字是一个模抛出的数量,并与其他抛出的数量)。然后定义Y X Y XXYXYXS = X + YYS=X+Y与两个骰子一起投掷的总数。例如,对于给定的骰子掷骰,我们可能会掷出3和5,所以总和为8。现在的问题是:该总和的分布是什么样的,它与各个分布有什么关系的和?在此特定示例中,每个骰子抛出的数字遵循[1,6]之间的(离散)均匀分布。该和遵循[1,12]之间的三角分布,且峰值为7。事实证明,可以通过对和的均匀分布进行卷积来获得该三角分布,并且该属性实际上对于(独立的)随机变量。Y X YXYXY


总结许多资金更结合多单总和值得其中注明有“+”号。我的偏好是说随机变量通过卷积合并
卡尔,

6
当然,卷积可以称为许多和的总和。但是您必须了解的是,卷积严格适用于求和变量的PDF。变量本身没有卷积。它们只是彼此相加,并且没有办法将加法理解为卷积运算(因此,正如现在所述,您问题的基本前提是不正确的)。
鲁宾·范·卑尔根

4
您误解了该参考。它指出:两个或多个独立随机变量之和的概率分布是它们各自分布的卷积。它并没有说两个随机变量的和与卷积这些变量是相同的。上面说的是分布的总和是的卷积分布的各个变量。随机变量及其分布是两个不同的事物。
鲁宾·范·卑尔根

当然,您可以对随机变量进行卷积。但是在那篇文章中(以及我在上面的回答中)广为人知和讨论的和/卷积属性并未处理随机变量的卷积。它是专门涉及款项随机变量,而款项的分配的属性。
鲁宾·范·伯根

1
(“当然,您可以对随机变量进行卷积。可以吗?我的理解是,因为要获得随机变量总和的分布函数,您需要对每个变量的质量/密度函数进行卷积,所以很多人(松散地)谈论卷积分布,以及关于卷积随机变量的一些(错误的
说法

6

首先要考虑过程或实验所有可能的不同结果的集合。令为给任何给定结果分配数字的规则(尚未指定)。让也一样。然后表示一个新规则用于为任何给定结果分配一个数字:将您从遵循规则获得的数字添加到您从遵循规则获得的数字。XωYS=X+YSXY

我们可以停在那里。为什么不将 称为和?S=X+Y

如果我们去定义一个概率空间,质量(或密度)随机变量的函数(这就是我们的规则现在) 通过卷积的质量(密度)函数可以得到与那的(当他们是独立的)。这里“卷积”具有其通常的数学意义。但是人们经常谈论不断变化的分布,这是无害的。甚至有时甚至是卷积的随机变量,这显然不是。如果它建议将“ ” 读为“ ”,那么“S=X+YXYX + ý X Ç ö Ñ v ö ü Ë d 瓦特ħ ý + X + ÿX+YX convoluted with Y+“前者表示复杂的操作,在某种程度上类似于或扩展加法的概念,而不是简单加法。我希望从上面的说明中可以清楚地看出,停止我说过的可能,已经很有意义了甚至没有将概率带入画面。X+Y

用数学术语来说,随机变量是这样的函数,其共同域是实数集,而域是所有结果集。因此, “ ”,在“ ”(或“ ”,明确表明自己的论点)承担完全意义“相同在”“ “。如果可以帮助实现直觉,最好考虑一下如何对已实现值的向量求和。但这不应引起对用于随机变量总和本身的表示法的混淆。+X+YX(ω)+Y(ω)+sin(θ)+cos(θ)


[此答案仅试图将@ MartijnWeterings,@ IlmariKaronen,@ RubenvanBergen和@whuber在其答案和评论中提出的观点简单地汇总在一起。我认为从解释什么是随机变量而不是卷积的方向可能会有所帮助。谢谢你们!]


(+1)努力。对我来说,答案太深了。但是,它确实使我陷入了困境。请阅读并让我知道您的想法。
卡尔,

正是椭圆符号使我感到困惑:表示所有,换句话说,向量加法。如果有人说“向量加法”而不是“加法”,那么我就不会想知道是什么意思,但不会说。= 1 2 3 n 1 nSi=Xi+Yii=1,2,3,...,n1,n
卡尔

好吧,如果将和实现放入向量中,并且想计算的实现向量,则可以使用向量加法。但这似乎是切线的。毕竟,您是否需要使用向量来解释' ',或者说该表达式中的' '表示向量加法?Y S sin θ + cos ϕ +XYSsin(θ)+cos(ϕ)+
Scortchi-恢复莫妮卡

做什么?上下文是离散数据,例如RV,而不是连续函数,例如PDF或,并且是普通和。sin θ + cos ϕ sin(θ)sin(θ)+cos(ϕ)
卡尔

1
@卡尔:(1)如果生物学家模拟否。鸡蛋作为Poisson rv放置在鸭巢中,实际上并没有增加鸡蛋无限的可能性。如果您对无限集在数学中的作用有疑问,请在数学或哲学SE上提问。(2)虽然名称很标准,但确实可以误导;因此我的答案。
Scortchi-恢复莫妮卡

3

回应您的“通知”,嗯,……不。

让,,和是随机变量,让。然后,一旦选择和,就强制。你让这两种选择,顺序,当你写 但是,这是一个卷积。ý ž ž = X + ý ž X Ŷ = ž - X P Ž = Ž = P X = X P Ý = ž - X d X XYZZ=X+YZXY=ZX

P(Z=z)=P(X=x)P(Y=zx)dx.

通知不见了。(+1)照顾您。
卡尔,

2

原因是幂函数的乘积与卷积有关。如果您合并到具有一定范围(例如,两个幂函数的幂或PDF的范围)并且新范围出现为原始范围总和的对象,则卷积总是自然出现。

x+y

如果您查看卷积的公式(对于离散值,只是因为我发现在那里更容易看到)

(fg)(n)=kf(k)g(nk)

nkkn

对于幂函数,我们得到

(a0+a1x1+a2x2++anxn)(b0+b1x1+b2x2++bmxm)=i=0m+nkakbikxi

它具有将左侧的高指数与右侧的低指数或反之亦然的总和相同的模式。

一旦看到,卷积实际上在做什么,即要组合哪些术语以及为什么它必须出现在许多地方,卷积随机变量的原因应该变得很明显。


2

n

来自Srinell JL的Grinstead CM。概率概论:美国数学学会;2012年 7,练习1:

XYfX(x)fY(y)X+YfX(x)fY(y)

Z(X,Y)ZfX(x)fY(y)XYX+YzZ

FZ(z)=P(X+Yz)=(x,y):x+yzfX(x)fY(y)dydx
=fX(x)[yzxfY(y)dy]dx=fX(x)[FY(zx)]dx.

zz

fZ(z)=dFZ(z)dz=fX(x)fY(zx)dx.

xxxx1+x2x值。当这种类型的加法发生多次重复时,总和的实现密度(结果密度)趋向于各个密度卷积的PDF。与组成的PDF(或求和数)相比,总体信息丢失会导致卷积(或和)的平滑(或密度分散)。另一个影响是卷积(或总和)的位置偏移。注意,多个元素的实现(结果,实例)仅提供稀疏元素来填充(例示)连续的样本空间。

10/921/4在此处输入图片说明

如图所示,增加求和解的解释似乎是合理的,因为左侧面板中数据的内核平滑分布(红色)类似于连续密度函数及其在右侧面板中的卷积。


@whuber最后,我想我明白了。总和是随机事件。请看一下我的解释,然后告诉我现在是否清楚。
卡尔,

3
谨慎使用语言会有所帮助。事件已。它们很少是数字集(这就是为什么它们的元素被称为“结果”)的原因。事件不会添加-随机变量的值会添加。关于“令人印象深刻的复杂”的问题只是一种干扰。的确,如果您想深入研究此问题,请确保示例中的求和项之一是零均值随机变量,因为均值会影响位置的整体变化。你想直观地了解卷积做,否则比移位置。
ub

@whuber谢谢您。仅在统计数据中,结果才是样本空间的单个元素。对于我们其他人来说,结果就是事件的结果。平滑和移位。我展示的是许多示例中最令人困惑的示例,因为它减少了叠加图的冲突。
卡尔

1
{,}AB|A||B|.

1
我认为在这些正在进行的编辑中我发现了潜在的混乱根源。因为要在评论中解释太久,所以我在答案中附加了编辑内容,希望对您有所帮助。确实,我的回答的第一行在该说法上有误导性,因此我也已通过道歉解决了该问题。
ub

1

这个问题可能很古老,但是我想提供另一个观点。它基于联合概率密度变量变化的公式。可以在2017年KTH的演讲笔记:概率和随机过程中找到(Koski,T.,2017,pp 67),它本身是Analysens Grunder,del 2(Neymark,M.,1970,pp 148-168)中的详细证明:


X=(X1,X2,...,Xm)fX(x1,x2,...,xm)Y=(Y1,Y2,...,Ym)

Yi=gi(X1,X2,...,Xm),i=1,2,...,m

gi(g1,g2,...,gm)

Xi=hi(Y1,Y2,...,Ym),i=1,2,...,m

Y

fY(y1,y2,...,ym)=fX(h1(x1,x2,...,xm),h2(x1,x2,...,xm),...,hm(x1,x2,...,xm))|J|

J

J=|x1y1x1y2...x1ymx2y1x2y2...x2ymxmy1xmy2...xmym|


X1+X2

X=(X1,X2)fX(x1,x2)Y=(Y1,Y2)

Y1=g1(X1,X2)=X1+X2Y2=g2(X1,X2)=X2.

逆映射是

X1=h1(Y1,Y2)=Y1Y2X2=h2(Y1,Y2)=Y2.

X1X2Y

fY(y1,y2)=fX(h1(y1,y2),h2(y1,y2))|J|=fX(y1y2,y2)|J|=fX1(y1y2)fX2(y2)|J|

J

J=|x1y1x1y2x2y1x2y2|=|1101|=1

Y1=X1+X2

fY1=fY(y1,y2)dy2=fX(h1(y1,y2),h2(y1,y2))|J|dy2=fX1(y1y2)fX2(y2)dy2

这就是我们找到您的卷积的地方:D


0

以下是n个连续随机变量之和的一般表达式:

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0216422

“复杂系统故障,级联灾难和疾病发作的多阶段模型”

对于正随机变量,总和可以简单地用拉普拉斯变换的乘积及其乘积的逆来表示。该方法是根据ET Jaynes的“概率论”教科书中的计算方法改编而来的。


欢迎来到我们的网站。您可能会在stats.stackexchange.com/questions/72479上找到该线程以及它所引用的Moschopolous论文,这是很有意思的。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.