如果,


9

假定设置如下:
Zi=min{ki,Xi},i=1,...,n。还有XiU[ai,bi],ai,bi>0。而且ki=cai+(1c)bi,0<c<1ki是各个支撑物边界的凸组合。c是所有i的共同点i

认为我的Z_i分布Zi正确:这是混合分布
它具有一个连续部分

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai
,然后是一个间断部分和一个离散部分,其中概率质量集中:
Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

因此,在所有

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

对于混合的“离散/连续”质量/密度函数,在间隔[a_i,k_i]之外为0,它具有一个连续部分,即均匀U(a_i,b_i)的密度,\ frac {1} {b_i-a_i},但对于a_i \ le z_i <k_i,它将正概率质量c> 0集中在z_i = k_i处0[ai,ki]U(ai,bi)1biaiaizi<kic>0zi=ki

总而言之,它等于现实的统一。

我想能够得出或表示随机变量S_n \ equiv \ sum_ {i = 1} ^ n Z_i的分布和/或矩Sni=1nZi,如n

假设,如果是独立的,则它看起来像为。我可以“忽略”该部分,即使只是近似值吗?然后,我将得到一个随机变量,其范围为,就像被审查的制服的总和一样,正成为“ ”的方式,也许还有一些中心极限定理...但是我可能在这里分歧而不是收敛,那么,有什么建议吗?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS:这个问题是相关的,派生检查变量的总和的分布,但是@Glen_b的答案不是我所需要的-我必须分析地处理这个问题,即使使用近似值也是如此。这是一项研究,因此请像对待家庭作业一样对待-一般建议或参考文献都足够。


如果需要,将的分布写为,并加上合适的,其中是Borel集。ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
2014年

@Zen我已经在问题中写道,分布是不连续的。同样,的RHS 显然表明,该表示的密度,但表示的概率-我更喜欢紧凑表示法。ff[ai,ki)ki
Alecos Papadopoulos

据我所知,带这种表示法是pdf格式,而pmf不存在。而且我们确实拥有适当的数学语言来精确描述混合分布。我怀疑当您发表研究论文时,这种表示法是否会被接受。当然只是我的意见。您应该始终按照自己喜欢的方式进行操作。f
2014年

@Zen Publishing还有很长的路要走-实际上,审阅者在看到未确定的符号时会皱眉。当人们想要描述多行中的逐步分布时,这只是一个简写。它没有“赞成”的说法,也没有反对已建立的表示法的,例如您在上一个注释中使用的。
Alecos Papadopoulos 2014年

Answers:


5

我会按照亨利的建议,用检查Lyapunov 。只要和的行为正常,混合发行的事实就不会成为问题。对每个,,的特定情况的仿真表明,正常性还可以。δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


确实很正常。很高兴知道。CLT的通常条件在这里从来都不是问题,我的问题是是否还有其他可能细微的问题扭曲了渐近结果并需要修改的CLT。您的仿真显示,实际上,随着更多变量输入总和,离散不连续性的概率可以忽略不计。
Alecos Papadopoulos 2014年

没什么特别的,但是它们不会带来任何问题。可以将它们视为行为良好的有限数,与索引无关。随着成长,它们可能会增加或减少(没有具体规则),并且它们中的任何一个都不比其他任何一个都成比例地增加……它们代表了尽管如此“可比”实体的大小差异。因此,林德伯格的状况肯定可以肯定ii
Alecos Papadopoulos 2014年

真好 祝您接下来的工作顺利。看起来像一个有趣的问题。
2014年

3

提示:

假设是固定的且是独立的,则可以计算每个的均值和方差:例如,你知道。 cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

然后,和增长不会太快,则可以使用Lyapunov或Lindeberg条件来应用中心极限定理,其结论是收敛于标准正态分布,或者在挥手的意义上,近似为正态分布,均值和方差。aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


谢谢。和没问题,它们不随索引增长,它们只是在波动。因此,您实际上是在说CLT还可以涵盖具有混合分布的随机变量吗?aibi
Alecos Papadopoulos

例如,如果和是固定的,则您将拥有具有有限方差的独立均匀分布的随机变量,因此将应用中心极限定理。这是否是混合物分布都不会影响此结果。我的意思是,如果均值和方差保持合理,则可以将其扩展到随机变量是独立的但分布不相同的情况。aibi
亨利

2

我对此问题的主要担心是,在我正在研究的情况下,是否可以像往常一样应用CLT。@Henry用户断言可以,@ Zen用户通过模拟展示了它。因此受到鼓舞,我现在将分析地证明这一点。

我首先要做的是验证混合分布的此变量是否具有“正常”力矩生成函数。表示的期望值,其标准偏差,及居中和缩放版本的通过。 施加变化的可变式我们发现,连续部分是 的时刻生成函数应该是 μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
k~i=kiμiσi,a~i=aiμiσi

使用质数表示导数,如果我们正确地指定了矩生成函数,则应该获得 ,因为这是居中且按比例缩放的随机变量。 事实上,通过计算衍生工具,应用洛必达法则很多次,(因为MGF在零值必须通过限制来计算),和做代数运算,我已经验证了前两个等式。第三个平等证明太累了,但我相信它成立。

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

因此,我们拥有适当的MGF。如果我们将其泰勒展开式的二阶近似为零,则

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

这意味着特征函数为(此处表示虚数单位) 。i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

根据特征函数性质,我们可以得出的特征函数等于Z~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

并且由于我们具有独立的随机变量,因此的特征函数 为1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

然后

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

通过数字的表示方式e。碰巧最后一项是标准正态分布的特征函数,根据Levy的连续性定理,我们有

1ninZ~idN(0,1)

这就是CLT。请注意,一旦我们考虑了变量的居中和缩放版本考虑了其MGF / CHF的二阶泰勒展开式,变量就不会以相同的方式分布,从视图中“消失” 这一事实:在这种近似水平下,这些函数是相同的,其余所有方面的差异都被压缩,这些差异逐渐消失。 Z

但是,当我们考虑平均行为时,从所有个体元素来看,个体水平上的特质行为就消失了,我相信使用诸如混合分布的随机变量之类的讨厌生物可以很好地展示这一事实。


真的很棒,Alecos。我的感觉是,论点应取决于和的更具体条件。例如:如果很快,证明会中断吗?(我知道在您的应用程序中不会发生这种情况。)您怎么看?aibi(biai)0
2014年

@Zen关于独立但不相同分布的rv的方差的问题是一个非常微妙的问题,我想我仍然不清楚。已知的Lyapunov或Lindeberg条件仅足以满足CLT的要求。在某些情况下,即使这些条件不成立,CLT仍然成立。因此,我认为,如果我们不对方差进行限制,那么就不会有一个单一的答案,问题就完全取决于具体情况了。就连比林斯利的书都不清楚。问题是其余的将是什么样子,我们能说些什么。
Alecos Papadopoulos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.