方差的反函数


9

对于给定的常数r(例如4),是否有可能找到的概率分布X,从而使Var(X)=r


1
不,除非您有其他信息。
Hemant Rupani 2015年

@Hemant Rupani需要什么额外的信息?
amiref

1
随机变量“ X”的任何性质……
Hemant Rupani 2015年

3
我建议您编辑问题,用“ X的分布”替换“ X的值”-如果X仅具有一个值,则X的退化分布将为零。
银鱼

1
除非r为负,否则答案显然是肯定的,方差可以是任何正数。
dsaxton

Answers:


13

rr=0XPr X = c = 0Pr(X=μ)=1Pr(X=c)=0cμXμR

如果,不分配可以发现,因为V - [R X = ÈX - μ X 20r<0Var(X)=E(XμX)20

对于,答案将取决于已知的有关X的其他信息。例如,如果X是已知有平均μ,则对于任何μ &Element; [R- [R > 0,我们可以通过取找到这些时刻分布X Ñ μ r>0XXμμRr>0 这不是均值和方差匹配问题的唯一解决方案,但它是唯一的正态分布解决方案(在所有可能的解决方案中,正如Daniel指出的那样,这是使熵最大化的解决方案)。如果您也想匹配,例如第三个XN(μ,r)中心矩或更高,那么您将需要考虑更大范围的概率分布。

假设我们有一些关于X分布的信息X而不是关于它的矩。例如,如果我们知道遵循泊松分布,则唯一的解决办法是X P ö 小号小号ø Ñ[R ) 如果我们知道,X如下的指数分布,然后再次存在唯一的溶液X ë X p ö Ñ Ë Ñ Ť 1XXPoisson(r)X,这里我们通过求解VarX=r=1找到了参数XExponential(1r)Var(X)=r=1λ2

在其他情况下,我们可以找到整个解决方案系列。如果我们知道遵循矩形(连续均匀)分布,则可以通过求解V a rX = r = w 2来找到该分布的唯一宽度wXwVar(X)=r=w212。但会有一个整体解决方案系列,由parametized 一个[R -在这组分布在彼此的所有翻译。同样,如果X是正常的,然后任意分布X ñ μ [R 会工作(所以我们有一整套的索引解决方案的μ,这也可以是任何实数,并再次家庭是彼此的所有翻译)。如果这样的XU(a,a+w)aRXXN(μ,r)μ遵循伽玛分布X然后,使用所述形状尺度参数,我们可以得到解决方案的整个家庭,由parametizedθ>0。这个家庭的成员不是彼此的翻译。为了帮助可视化“解决方案族”的外观,下面是一些以μ为索引的正态分布示例,然后以θ为索引的伽玛分布示例,所有方差均等于4,对应于您问题中的示例r=4XGamma(rθ2,θ)θ>0μθr=4

正态分布,方差四 具有方差4的伽马分布

另一方面,对于某些分布,取决于的值,可能会或可能不会找到解。例如,如果X必须是一个伯努利变量然后0 [R < 0.25rX0r<0.25有两种可能的解决方案因为有两个概率p其中求解方程式V - [R X = r = p XBernoulli(p)p,实际上这两个概率是互补的,即 p 1 + p 2 = 1。对于 r = 0.25,只有唯一解 p = 0.5,对于 r > 0.25,则没有伯努利分布具有足够高的方差。Var(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

我觉得我也应该提到的情况。对于这种情况也有解决方案,例如具有两个自由度的Student t分布r=t

情节的R代码

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 

17

假设你的意思是“是否有可能找到一个概率分布 ”,那么答案是肯定的,因为你没有指定任何标准的X必须满足。实际上,有无限数量的可能分布可以满足此条件。只考虑一个正态分布,ÑX ; μ σ 2。可以设置σ 2 = - [Rμ可以取任何值你喜欢-那么你将有V - [R [ X ] = - [RXXN(x;μ,σ2)σ2=rμVar[X]=r为必需的。

实际上,正态分布在这方面非常特殊,因为它是给定均值和方差的最大熵概率分布


您说得对,我已更正。您能再解释一下吗?
amiref

@AmirEf还不清楚什么?
丹尼尔(Daniel)

6
丹尼尔还应该解释什么还不清楚。这里的答案似乎可以解决您发布的问题中的所有问题。
Glen_b-恢复莫妮卡2015年

15

这个问题可以用一种有趣的方式来解释,而不是完全琐碎的。 鉴于一些看起来像一个随机变量,在何种程度上有可能以这样的方式分配概率,以自己的价值观(或移位的存在概率左右),其方差等于预先设定的一些数X?答案是所有可能的值 [R 0是允许的,由极限确定通过的范围 Xrr0X

这种分析的潜在兴趣在于改变概率测度,同时保持随机变量固定以实现特定目标的想法。尽管此应用程序很简单,但是它显示了Girsanov定理的某些思想,这是数学金融学的基础。


让我们以严格,明确的方式重申这个问题。假设

X:(Ω,S)R

是用sigma代数S在测量空间上定义的可测量函数。对于给定的实数r > 0,何时有可能在此空间上找到一个概率度量P,对于该概率度量,Var X = rΩSr>0PVar(X)=r

我相信答案是,这是可能的,当sup(X)inf(X)>2r (如果同时达到最大和最小,则等式可以成立:也就是说,它们实际上是的最大值和最小值。)当supX=infXsup(X)=,该条件强加任何限制 [Rinf(X)=r,则所有非负的方差值都是可能的。

证明是通过构造。 让我们从它的简单版本开始,以照顾细节并确定基本思想,然后继续进行实际构建。

  1. 是图像中X:此装置有一个ω X&Element; Ω为其中X ω X= X。定义一组函数P小号[ 0 1 ]是的指示器ω X:即,P= 0如果ω XPxXωxΩX(ωx)=xP:S[0,1]ωxP(A)=0ωxA ω XP(A)=1ωxA

    由于,显然P满足概率的前两个公理。有必要证明它满足第三点。即,它是sigma可加的。但是,这几乎是显而易见的:每当{ ë = 1 2 ... }是有限或可数无限集合互斥事件,那么它们中的任无含有ω X --in这种情况下,PË 对于所有= 0P(Ω)=1P{Ei,i=1,2,}ωxP(Ei)=0i--or确切地说是其中之一包含,在这种情况下P 0对于所有Ĵ。在任一情况下ωx对于某些特定的 j,否则 PE i=P(Ej)=1jP(Ei)=0ij

    P(iEi)=iP(Ei)

    因为双方均为或均为101

    由于集中在所有的概率ω X,分布XPωxX集中在X必须具有零方差。xX

  2. 是在范围内的两个值X ; 即,X ω 1= X 1X ω 2= X 2。以类似于前面的步骤的方式,定义的量度P为的指标的加权平均值ω 1ω 2。使用非负权重1 - ppp确定。和以前一样,我们发现Px1x2XX(ω1)=x1X(ω2)=x2Pω1ω21pppP作为(1)中讨论的指标度量的凸组合-是概率度量。的分布相对于该测量是伯努利p 已经由缩放分布X 2 - X 1和由移位- X 1。因为伯努利p 分布的方差是p 1 - p ,所以X的方差必须是x 2X(p)x2x1x1(p)p(1p)X(x2x1)2p(1p)

的(2)的直接后果是,任何为其存在X 1X 2中的范围X0 p < 1为其中rx1x2X0p<1

r=(x2x1)2p(1p)

可以是的方差。由于0 p 1 - p 1 / 4,这意味着X0p(1p)1/4

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

当且仅当具有最大值和最小值时,才保持相等。X

相反,如果超过此结合的SUP X - INF X 2 / 4r(sup(X)inf(X))2/4,则没有解决方案是可能的,因为我们已经知道,任何界随机变量的方差不能超过四分之一的平方其范围。


3
杜德(Dude),我认为您与OP的水平完全不同。
Mark L. Stone

4
@马克可能。(我认为您在这里发现了一种非常干躁的幽默感。)但是,任何将数学统计标签应用到其帖子中的人都应该期待这种东西:-)。
ub

2
这让我想起了我从已故的塞缪尔·卡林教授(卡林和泰勒等人的名字)中选修了4个学生课程时所讲的“总积极性”。博弈论的话题以某种方式出现了。他说,哦,博弈论。您有两个非负的sigma有限度量....,现在想象他以这种方式向博雅艺术学院新生经济学班的学生介绍了博弈论。这就是您的帖子让我想到的。
Mark L. Stone

@马克了解。一个人不会那样做而成功。如您所指出的,我在这里是为一般读者(的一部分)而不是特定读者写的。另一方面,抽象学科并不难(在这个初级水平上),事实证明,文科学院的上进心的低年级学生可以接触到抽象的学科。例如,请参阅stats.stackexchange.com/a/94876上的评论。
ub

4
@ MarkL.Stone答案不仅仅适用于即时提问者(SE旨在作为一个好问题和好答案的存储库,对于以后有类似问题的人来说是有价值的),并且我们已经在此处获得了对该问题的更基本视图的答案。其他一些读者可能会从不太初级的事物中获得一些东西,因此各种样式和答案级别使该问题对更多人有用。
Glen_b-恢复莫妮卡2015年

10

是的,有可能找到这种分布。实际上,您可以采用具有有限方差的任何分布,并进行缩放以匹配您的条件,因为

Var[cX]=c2Var[X]

例如,均匀分布于间隔具有方差:σ 2 = 1[0,1] 因此,在间隔的均匀分布[01

σ2=112
将具有方差r[0,112r]r

实际上,这是向某些分布中添加参数的常用方法,例如Student t。它只有一个参数自由度。当ν ∞时,分布收敛到标准正态。它是钟形的,看上去很像正常,但尾巴较胖。这就是为什么当尾巴很胖时,它通常被用作正态分布的替代方法。唯一的问题是高斯分布具有两个参数。因此,出现了Student t的缩放版本,有时也称为“ t location scale”分布。这是一个非常简单的变换:ξ = - μνν,其中μs是位置和比例。现在,您可以设置比例,以便新变量ξ具有所需的任何方差,并具有学生t分布的形状。ξ=tμsμ,sξ

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.