卡方变量的无穷集合的阶数统计(例如最小值)?


11

这是我第一次来,因此,请让我知道我是否可以以任何方式(包括格式,标签等)来澄清我的问题。(希望我以后可以编辑!)我试图找到参考,并尝试使用归纳法解决自己,但都失败了。

我正在尝试简化一种分布,该分布似乎可以简化为具有不同自由度的无数独立随机变量的无穷集合的有序统计。具体而言,在独立的中第个最小值的分布是什么?χ2mχ22,χ42,χ62,χ82,

我会对特殊情况感兴趣:(独立)的最小值的分布是什么?m=1χ22,χ42,χ62,

对于最小的情况,我能够将累积分布函数(CDF)编写为无限乘积,但无法进一步简化。我使用了的CDF 为 (对于m = 1,这确认了下面关于等价指数为2的等价物的第二条评论。)则最小CDF可以写为F_ {min}(x)= 1-(1-F_2(x) )(1-F_4(x))\ ldots = 1- \ prod_ {m = 1} ^ \ infty(1-F_ {2m}(x))= 1- \ prod_ {m = 1} ^ \ infty \ left (e ^ {-x / 2} \ sum_ {k = 0} ^ {m-1} \ frac {x ^ k} {2 ^ kk!} \右)。 产品中的第一项只是e ^ {-x / 2},而“最后”项是χ2m2= 1 ˚F 中号Ñ

F2m(x)=γ(m,x/2)/Γ(m)=γ(m,x/2)/(m1)!=1ex/2k=0m1xk/(2kk!).
m=1= 1 - Π=
Fmin(x)=1(1F2(x))(1F4(x))=1m=1(1F2m(x))
ex/2e
=1m=1(ex/2k=0m1xk2kk!).
ex/2ex/2k=0xk/(2kk!)=1。但是我不知道如何(如果可能的话)从那里简化它。也许完全不同的方法更好。

另一个可能有用的提示:χ22与期望值为2的指数分布相同,χ42是两个此类指数的总和,以此类推

如果有人好奇,我想简化本文中的定理1,以便针对常数(所有i的xi=1进行回归。(由于我乘以2 \ kappa,因此具有\ chi ^ 2而不是\ Gamma分布。)iχ2Γ2κ


请问这个回答你的问题?
mpiktas 2011年

@mpiktas:感谢您的建议。相似之处在于,除了具有不同速率参数的指数函数外,我还具有不同自由度的卡方(并且卡方数无限,不是有限的)。而是指数,而点不是;它们是指数的和,但指数本身不是指数的。(并且理想情况下,我希望有一个一般的订单统计信息,尽管分钟数将是一个不错的开始。) χ 2χ22χ42,χ62,
David M Kaplan

1
我怀疑是否有封闭表格。但是,它的确具有奇怪的特征:当是iid时,泊松()变量,则是所有。 λ / 2 ķ = 1 2 ... 1 - ˚F Xkλ/2k=1,2, X ķķ1Fmin(λ)Xkk
ub

1
@whuber:从泊松过程的角度来看,这也许不是很奇怪,这是我一直在使用的公式。令为iid随机变量,并具有相应的泊松过程为的速率。令,,,。然后,是独立的,并且通过泊松过程的平稳独立增量属性,我们拥有。Ë X p1 / 2 Ñ = SUP { Ñ Σ Ñ = 1 Ť } 1 / 2 Ù 1 = Ť 1 Ù 2 = Ť 2 + Ť 3T1,T2,Exp(1/2)N(t):=sup{n:i=1nTit}1/2U1=T1U2=T2+T3ü χ 2 2 Pû = PÑ U3=T4+T5+T6Uiχ2i2P(Uit)=P(N(t)i)
主教

@Cardinal当然:那是查看它的好方法。好奇心并不在于泊松和伽玛之间的关系。它在于对事件本身的描述!
Whuber

Answers:


8

无限积的零将是项的零的并集。计算到第20项显示了一般模式:

复零的图

复数平面中零点的这种图通过不同的符号来区分乘积中各个项的贡献:在每个步骤中,视在曲线进一步延伸,新曲线甚至向左延伸。

这幅图的复杂性表明,就众所周知的高级分析功能(例如,伽马,θ,超几何函数等)以及基本函数(如经典文本如Whittaker中所调查的)而言,没有封闭形式的解决方案&Watson)。

因此,问题的产生可能会有所不同,那就是:您需要了解有关订单统计信息分布的哪些信息?估计其特征功能?低阶时刻?接近分位数?还有吗


为什么产品的零值很重要?我觉得我缺少一些琐碎的东西。
mpiktas 2011年

2
@mp零点和极点说明函数的复杂性。有理函数的数量有限。基本函数通常具有零行,例如在,整数。典型的“先验”函数具有稍微更复杂的零模式,例如在所有非正整数(伽玛函数的倒数)处或在点阵上(θ函数和椭圆函数)。这里展示的复杂模式表明,根据这些熟悉的功能来表达CDF将非常困难或不可能。Ñ EXP 2iπnnexp()
Whuber

2
@whuber(1/2),谢谢!我不知道在复杂平面上具有不同零模式的不同类的函数。听起来很有用,您的图表似乎可以回答我的问题(按实际情况)。
大卫·M·卡普兰

@whuber(2/2),这是在检查另一篇论文中给出的(复杂)估计量分布的特殊情况。他们使用发行版的存在来证明使用引导程序是合理的。我的顾问建议我尝试估算分布。在这种特殊情况下(我知道应该是什么情况),似乎他们的分配可能不正常,因此我将在顾问的资助截止日期之后与顾问联系。但潜在地,我将尝试在更复杂的设置中将阶统计量(除以)的高阶展开表示为。如果是这样,将再次发布;再次感谢!m m mmm
大卫·M·卡普兰

4

(独立)的最小值的分布是什么?χ22,χ42,χ62,

抱歉,迟到了6年。即使OP现在可能已经转移到其他问题上,但问题仍然是新鲜的,我想我可能会建议另一种方法。


我们得到其中其中和pdf的:X i(X1,X2,X3,)v = 2 XiChisquared(vi)vi=2ifi(xi)

在此处输入图片说明

这是对应的pdf的,随着样本数量的增加,对于:fi(xi)i=1 to 8

在此处输入图片说明

我们对的分布感兴趣。min(X1,X2,X3,)

每次我们添加一个额外的术语时,所添加的最后一个术语的pdf都会向右移得越来越远,因此添加越来越多的术语不仅变得越来越不相关,而且仅仅经过了几个术语,几乎可以忽略不计-就最小样本量而言。实际上,这意味着实际上只有非常少的术语可能很重要……而添加额外的术语(或存在无限数量的术语)与样本最小问题在很大程度上无关。

测试

为了对此进行测试,我已经将的pdf计算为1个术语,2个术语,3个术语,4个术语,5个术语,6个术语,7个术语,8个术语,至9个学期和10个学期。为此,我使用了mathStatica中的函数,指示它在这里计算大小为的样本中样本最小值(阶次统计量)的pdf ,其中参数(而非是固定的)是:1 min(X1,X2,X3,)OrderStatNonIdentical1stjv iivi

在此处输入图片说明 在此处输入图片说明

随着术语数量的增加,它变得有点复杂...但是我在上面显示了1个术语(第一行),2个术语(第二行),3个术语(第三行)和4个术语的输出。

下图将样本最小值的pdf与1个术语(蓝色),2个术语(橙色),3个术语和10个术语(红色)进行比较。请注意,只有3个条件对10个条件的结果是多么相似: 在此处输入图片说明

下图比较了5个项(蓝色)和10个项(橙色)-这些图是如此相似,它们相互抵消,甚至看不到差异:

在此处输入图片说明

换句话说,将项数从5增加到10对样本最小值的分布几乎没有明显的视觉影响。

半逻辑近似

最后,样本min的pdf的一个很好的简单近似是pdf的半Logistic分布:

g(x)=2ex(ex+1)2 for x>0

下图将准确的解决方案与10个项(与5个项或20个项无法区分)和半Logistic近似值(虚线)进行比较:

在此处输入图片说明

增加到20个字词没有明显区别。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.