转换变量密度的直观解释?


37

假设是pdf的随机变量。然后,随机变量具有pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

我了解背后的原因。但我正在尝试寻找一种方法来向不了解微积分的人进行解释。特别是,我试图解释为什么出现在前面。我会刺一下它:1y

假设具有高斯分布。pdf的几乎所有权重都在值之间,例如和但是对于,它映射到0到9 。因此,在将转换为的pdf中,权重已扩展到更大范围的值。因此,为真正的pdf,必须通过乘数来降低额外的权重X33.YXYfY(y)1y

听上去怎么样?

如果有人能提供更好的解释或链接到文档或教科书中的内容,我将不胜感激。我在几本数学概论/统计入门书籍中找到了这个变量转换示例。但是我从来没有找到一个直观的解释:(


我认为您的解释是正确的。
highBandWidth 2011年

2
解释是正确的,但纯粹是定性的:乘法因子的精确形式仍然是个谜。-1/2力量简直神奇地出现了。因此,在某种程度上,您必须做与微积分相同的事情:找到平方根函数的变化率。
ub

Answers:


37

PDF是高度,但它们用于通过面积表示概率。 因此,它有助于以提醒我们面积等于高度乘以基数的方式来表达PDF。

最初,任意值的高度都由PDF。基数是无穷,因此分布(即,与分布函数相对的概率测度)实际上是微分形式或“概率元素”,xfX(x)dx

PEX(x)=fX(x)dx.

您要在概念上和实践上都使用此对象而不是PDF,因为它明确包含了表达概率所需的所有元素。

当我们根据重新表达时,基段会被拉伸(或压缩):通过将到区间的两端平方,我们看到区域的基点必须是长度间隔xy=x2dxxx+dxy

dy=(x+dx)2x2=2xdx+(dx)2.

由于与无穷小数本身相比,两个无穷小数的乘积微不足道,我们得出结论

dy=2xdx, whence dx=dy2x=dy2y.

确定了这一点之后,计算就变得微不足道了,因为我们只是插入了新的高度和新的宽度:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

因为以的底数是,所以乘以它必须是高度,我们可以直接从中间项中读取为ydy

12yfX(y)=fY(y).

式 实际上是面积守恒定律(=概率)。PEX(x)=PEY(y)

两个PDF

该图形准确地显示了与相关的两个PDF的窄块(几乎是无穷小)。概率由阴影区域表示。由于通过平方压缩间隔,红色区域(左侧的)的高度必须按比例扩大以匹配蓝色区域(右侧的)的面积。y=x2[0.32,0.45]yx


2
我爱无穷小。这是一个很好的解释。用进行思考比用思考要直观得多,该可以清楚地看出是从变换的派生而来的。我认为这就是我的症结所在。2xy
lowndrul

@whuber,我相信您的第一行应该是吗?这是吗?PS:也对您对我的答案的想法感到好奇(下)。P(X(x,x+dx))=fx(x)dxpdfX(x)
卡洛斯的Cinelli

@Carlos首先要表达我的想法,但要严格一些:PDF是将Lebesgue测度乘以得到给定的概率测度。dx

@whuber,但是如果pdf是您要乘的pdf,则它是术语,而不是您所写的乘积,对吗?目前尚不清楚为什么将产品称为pdf。fX(x)fx(x)dxfX(x)dx
Carlos Cinelli

1
@Carlos:谢谢;现在我明白你的意思了。我进行了一些修改以解决此问题。
ub

11

如果我制造的物体总是正方形,又知道正方形的边长分布,该怎么办?关于正方形的面积分布我能说些什么?

特别是,如果我知道随机变量的分布,那么关于我能说什么 ?您可以说的一件事是XY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

因此在 CDF和的CDF之间建立了关系; 它们的PDF之间有什么关系?为此,我们需要微积分。取双方的导数会给您想要的结果。YX


2
(+1)尽管这不是一个完整的答案,但它为找到提供了一个好方法,并清楚地说明了为什么它是两部分之和,每个平方根一个。fY
ub

1
我不明白为什么pdf(x)= f(x)dx。pdf(x)dx = f(x),density = prob mass/interval...我怎么了?
费尔南多

2

假设我们有一个人口,是该人口的汇总。然后计算范围中具有变量的个体的比例。您可以将其视为大小的“容器”,我们正在计算该容器中有多少个人。YP(Y(y,y+Δy))Y(y,y+Δy)Δy

现在,让我们根据另一个变量重新表达这些个体。假设我们知道和的关系为,则事件与事件与事件。因此,位于垃圾箱的个体也必须位于垃圾箱和。换句话说,这些垃圾箱必须有相同比例的个人,XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

好的,现在让我们开始讨论密度。首先,我们需要定义什么是概率密度。顾名思义,它是每个区域中个人的比例。也就是说,我们计算该垃圾箱上的个人份额,然后除以垃圾箱大小。由于我们已经确定这里的人口比例是相同的,但是垃圾箱的大小已更改,因此我们得出结论,密度将有所不同。但是相差多少呢?

就像我们说过的那样,概率密度是垃圾箱中人员的比例除以垃圾箱的大小,因此的密度由。类似地,的概率密度由。YfY(y):=P(Y(y,y+Δy))ΔyXfX(x):=P(X(x,x+Δx))Δx

根据我们先前的结果,每个垃圾箱中的人口都是相同的,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

也就是说,密度改变因数,这是拉伸的相对大小或挤压垃圾箱大小。在我们的例子中,由于,所以我们有。如果足够小,我们可以忽略,这意味着和,这就是为什么出现在变换中的原因。fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.