两重分布之差的分布是什么


19

...为什么?

假设,是独立的随机变量,分别具有均值和方差。我的基本统计书告诉我的分布具有以下属性:X1个μ 1μ 2 σ 2 1σ 2 2 X 1 - X 2X2μ1个μ2σ1个2σ22X1个-X2

  • ËX1个-X2=μ1个-μ2
  • Var(X1X2)=σ12+σ22

现在,假设, 是自由度为, t分布。的分布是什么?X 2 n 11 n 22 X 1X 2X1个X2ñ1个-1个ñ2-2X1个-X2

这个问题已经过编辑:最初的问题是“两个t分布的差异的自由度是多少?” 。mpiktas已经指出,这是没有道理的,因为不是t分布的,无论近似值(即高df)如何。X1个-X2X1个X2


1
这是一个可能引起关注的相关问题
mpiktas 2011年

2
Google进行了Satterthwaite t检验,CABF t检验(Cochran对Behrens-Fisher的近似)和Behrens-Fisher问题。
ub

3
对于自由度为1(柯西分布)的特殊情况,原始问题的答案为1。两个独立柯西分布随机变量的和(或差)为比例参数为柯西,但同样,柯西分布甚至没有平均值。2
NRH

1
您需要检查Behrens–Fisher发行版
2016年

Answers:


15

两个独立的t分布随机变量的总和不是t分布的。因此,您无法谈论此分布的自由度,因为从t分布来看,所得的分布没有任何自由度。


@mpiktas:愚蠢的问题。如果可以从n个独立正态分布的总和中得出n-1 df的t分布(请参阅维基百科),并且给定df足够高,以使t分布近似于正态分布,则不能从该总和中得出的t分布又是t分布?
steffen 2011年

@mpiktas:那么t检验的检验统计呢?这似乎是从两个t分布的差异中得出的?
steffen 2011年

1
@steffen,不。由于您将添加两个近似正态分布的正态变量,因此它将近似正态。高df的t分布近似正常,但高df的t分布不一定正常。
mpiktas 2011年

1
steffen,t检验统计量是根据两个法线而不是两个t分布的差得出的。请注意,t分布的定义是卡方的正态和平方根的分数。
mpiktas 2011年

1
@steffen,我经常对我的学生说没有愚蠢的问题,只有愚蠢的人不问任何问题。我不是一个非常受欢迎的老师,我应该补充一下:)
mpiktas,2011年

4

同意以上答案,两个独立的t分布随机变量之差不是t分布。但我想添加一些计算方法。

  1. 最简单的计算方法是使用蒙特卡洛方法。例如,在R中,您从第一个t分布中随机抽取100,000个数字,然后从第二个t分布中随机抽取另外100,000个数字。您让第一组100,000个数字减去第二组100,000个数字。从这两个分布之间的差的分布中获得的100,000个新数字是随机样本。您只需使用mean()和即可计算均值和方差var()

    1. 这称为贝伦斯-费舍尔分布。您可以参考Wiki页面:https : //en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution。由该分布给出的配置项称为“基准间隔”,这不是配置项

    2. 数值积分可能会起作用。这是作为要点2继续的内容。您可以参考Box,George EP,Tiao,George C撰写的《贝叶斯统计分析中的贝叶斯推理》中的2.5.2节。它具有详细的集成步骤,以及如何将其近似为贝伦斯-费舍尔分布。


1
在我看来,贝伦斯-费舍尔分布适用于两个t分布的方差不相等的情况。如果两个分布的方差相等,可以说相同吗?
伊恩·苏德贝里

1
对不起,早点输入两个?继续...例如,说我们有两个相等但未知的方差,但均值不同的正态分布。我们从每个分布中抽取两个样本。来自相同分布的两个样本之间的均值差异将遵循t分布,但是差异的差异的分布是多少。
伊恩·苏德贝里
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.