来自同一分布族的两个随机变量是否可能具有相同的期望和方差,但具有更高的矩?


12

我在考虑位置规模家庭的含义。我的理解是,对于位置标尺族的每个成员,其参数分别位置标尺和b标尺,则Z =(Xa)/ b的分布不取决于任何参数,并且属于该族的每个X都是相同的。XabZ=(Xa)/bX

所以我的问题是,您能否提供一个示例,其中将来自同一分布族的两个随机数标准化,但不会导致具有相同分布的随机变量?

假设XY来自同一个分布族(例如,我所说的族指正态或Gamma等等)。限定:

Z1=Xμσ

Z2=Yμσ

我们知道Z1Z2都具有相同的期望和方差,μZ=0,σZ2=1

但是他们可以有更高的时刻吗?

我试图回答这个问题的尝试是,如果XY的分布Y取决于两个以上的参数。我正在考虑具有3个参数的广义tstudent

但是,如果参数数量为2并且XY来自相同的分布族,并且具有相同的期望和方差,那么是否意味着Z1Z2具有相同的分布(较高的矩)?


4
是的他们可以。但是,在一般分布中,您至少需要3个参数。
卡尔,

5
@Carl一个参数就足够了。
whuber

5
@Carl不清楚您所说的“相同分配”是什么意思。从字面上看,这是指唯一的分布,具有一个定律,因此是唯一的期望,唯一的方差和唯一的矩(在定义它们的范围内)。如果您的意思是“相同的分配家庭 ”,那么您的言论毫无意义,因为您所定义的家庭是您所要定义的。
whuber

3
@HardCore既然您似乎感觉自己的问题已得到回答,请参阅当有人回答我的问题时该怎么办?
Glen_b-恢复莫妮卡(Monica)

2
@卡尔我也赞成你的回答。OP的用法似乎支持的概念,因为该族中所有选择都具有相同的标准分布。让我们看看OP接受哪个答案(如果OP曾经读过Glen_b的评论并对其执行操作)。XZ=(Xa)/bX
Dilip Sarwate

Answers:


7

关于什么是分布族以及如何对自由参数与自由加上固定(分配)参数进行计数,显然存在一些混淆。这些问题放在一边,与OP的意图以及此答案无关。我在此不使用“ 家庭 ”一词,因为它会引起混淆。例如,根据一个来源是改变形状参数的结果。@whuber指出阿一个家庭的“参数化”是从ℝ的一个子集的连续映射,以其平常的拓扑结构,为分布的空间,其图像是家庭。我会用这个词的形式覆盖字都使用目的n x 22x+4 a 2 x 2 + a 1 x+ a 0 a 1 =0 a 2 =0参数的识别和计数。例如,公式具有二次公式的形式,即,如果则公式仍为二次形式。但是,当,公式是线性的,并且形式不再足够完整以包含二次形项。鼓励那些希望在适当的统计背景下使用“家庭”一词的人回答这个单独的问题x22x+4a2x2+a1x+a0a1=0a2=0

让我们回答“他们可以有不同的更高时刻吗?”的问题。有很多这样的例子。我们顺便注意到,问题似乎与对称PDF有关,在简单的双参数情况下,它们往往具有位置和比例。逻辑:假设有两个具有不同形状的密度函数,具有两个相同的(位置,比例)参数。然后,要么有一个调整形状的形状参数,要么是密度函数没有共同的形状参数,因此是没有共同形式的密度函数。

这是形状参数如何计算的一个示例。在广义的错误密度函数,并在这里,是,似乎有一个自由选择的峰度答案。

在此处输入图片说明

由Skbkekas-自己的作品,CC BY-SA 3.0,https://commons.wikimedia.org/w/index.php?curid = 6057753

PDF(又称为“概率”密度函数,请注意单词“概率”是多余的)是

β2αΓ(1β)e(|xμ|α)β

均值和位置是,比例尺是,而是形状。请注意,呈现对称PDF较为容易,因为这些PDF通常具有位置和比例为最简单的两个参数的情况,而非对称PDF(如gamma PDF)往往具有形状和比例为最简单的情况的参数。继续使用误差密度函数,方差为,偏度为,峰度为μαβα 2 Γ 3α2Γ(3β)Γ(1β)0Γ(5β)Γ(1β)Γ(3β)23。因此,如果我们设定方差为1,则我们分配的值从同时更改,因此峰度可以在到的范围内选择。αα2=Γ(1β)Γ(3β)β>00.601114

也就是说,如果我们想改变高阶矩,并且想要保持均值为零且方差为1,则需要改变形状。这意味着三个参数,通常是1)位置的均值或其他适当的度量; 2)调整方差的标度或其他变异性度量; 3)形状。它至少需要三个参数才能做到。

请注意,如果在上面的PDF中进行替换,,我们将获得β=2α=2σ

e(xμ)22σ22πσ,

这是正态分布的密度函数。因此,广义误差密度函数是正态分布密度函数的广义。有很多方法可以归纳正态分布的密度函数。另一个示例是学生的密度函数,但正态分布的密度函数仅作为极限值,而没有像一般误差密度函数那样的中间范围替换值。使用Student的密度函数,我们将对峰度的选择更为严格,并且是shape参数,因为对于,第二矩不存在。而且dfttdf2df<21 - DF →交通实际上并不限于正整数值,通常是实数。学生的仅在正常情况下变为,这就是为什么我没有选择它作为示例的原因。这既不是一个很好的例子,也不是一个反例,因此我不同意@ Xi'an和@whuber。1tdf

让我进一步解释一下。例如,一个人可以选择两个参数的许多任意密度函数中的两个,使其平均值为零,方差为1。但是,它们并非都具有相同的形式。但是,问题与SAME形式的密度函数有关,而不是与其他形式有关。有人声称,哪个密度函数具有相同的形式是任意分配,因为这是定义问题,而且我认为是不同的。我不同意这是任意的,因为一个人可以进行替换以将一个密度函数转换为另一个密度函数,或者一个不能。在第一种情况下,密度函数是相似的,如果通过替换我们可以证明密度函数不相等,则这些密度函数具有不同的形式。

因此,以学生 PDF 的示例为例,可以选择将其视为普通PDF的一般化,在这种情况下,普通PDF具有学生 PDF的允许形式,或者,在这种情况下,学生的的PDF与普通PDF的格式不同,因此与提出的问题无关ttt

我们可以以多种方式争论。我的意见是,普通PDF是学生 PDF的子选择形式,但是即使可以显示伽玛PDF的极限值,普通PDF也不是伽玛PDF的子选择。成为普通PDF,我的原因是,在普通/学生'情况下,支持是相同的,但是在普通/伽玛情况下,支持是无限的与半无限的,这是必需的不兼容性。tt


6
(-1)正如其他评论所述,问题是“发行家庭是什么意思?”。我可以轻松地定义一个新的分布“族”,这些分布族只是简单地重新缩放了t分布,以具有单个参数df的平均值= 0,sd = 1。那么对于所有df来说,第一和第二力矩都是相等的,但是对于不同的df值,它们具有不同的较高力矩。
悬崖AB

5
硬核,鉴于您的标题本身包含“家庭”一词,因此很难理解该评论!此外,如果您否认家庭有意义,那么这个问题就没有意义。请通过编辑问题来阐明您的意图。
ub

5
-1,因为您首先说“答案是否定的”。然后给出一个有效回答“是”的示例(您最好提及的kjetilbhalvorsen的回答中给出了另一个示例)。这对我来说没有意义。我认为这里的数学对我们所有人都很清楚,因此我的反对意见仅是因为表达方式缺乏一致性。
变形虫说莫妮卡(

3
Carl,问题和Hard Core的评论之间存在明显的矛盾。问题很明确:“提供一个示例,其中来自同一分布族的两个随机[变量]被标准化,但是不会导致具有相同分布的...随机变量”。显然,“家庭”的某些含义是有意的。尽管存在各种技术变体,但通常的含义很清楚,并且(容易证明)正确答案是“是的,有很多这样的例子”。
whuber

4
谢谢。显然,您对所写的内容有很好的理解,但是不幸的是,您的帖子对“分布”,“形状”,“形式”和“参数”的含义可能引起了很大的困惑。作为微妙的一个例子,考虑由任何具有非零的第三中心矩的分布定律创建的分布族。该族由两个实数索引,并且由所有定律。这是一个位置规模的家庭,但是这些定律的形式根据的符号而有所不同。μ σ 0 X ˚F σ X + μ σF(μ,σ0)xF(σx+μ)σ
ub

17

如果您想要一个“正式命名的参数化分布族”的示例,则可以查看广义的伽马分布,https://en.wikipedia.org/wiki/Generalized_gamma_distribution。该分布族有三个参数,因此您可以修正均值在Wiki页面上,代数看起来并不诱人,我宁愿用数字方式进行计算。对于统计应用,请在该站点上搜索gamlss,这是gam(通用添加剂)的扩展模型本身就是glm的概括),这些参数具有“位置,比例和形状”参数。

另一个例子是,扩展为位置尺度族。然后,第三个参数将是自由度,它将对固定位置和比例的形状保持警惕。t


1
尽管广义误差分布可能是更好的选择。
卡尔,

2
非常感谢您的回答!!我选择Carl,因为它比较详细,但这也很好..非常感谢!
gioxc88

14

有无数个均值为零且方差为1的分布,因此从这些分布之一的分布,例如,从另一个分布中的,例如学生的带有54个自由度的通过重新缩放,使其方差为1,则 喜欢您提到的属性。参数的“数量”与属性无关。Ñ0 1 ε 2ϵ1N(0,1)ϵ2t X=μ+σε113

X=μ+σϵ1andY=μ+σϵ2

显然,如果您对该族的定义设置其他规则,例如声明存在一个固定的密度,使得的密度为,最终可能会得到一个可能的分布。X 1fX

1σdf({xμ}/σ)

谢谢您的回答,但我认为这不是我要的
gioxc88

6
我认为这是因为,如果族的分布是由Y的分布的团聚定义的,那么您与该属性存在矛盾。分布的“族”是一个模糊的概念。XY
西安

是的,其实是很模糊的,但如果你看了我的问题,我写道,在这种情况下与家人我的意思是,例如正常或两个伽玛等..你用一个正常的和一个做出了表率t斯
gioxc88

4
硬核,您似乎将家庭名称与其概念混淆了。这个答案是一个很好的答案,很好地说明了这个概念。您的问题并不要求解决方案是一个地点规模的家庭。如果您希望它成为一个整体,则可以始终采用此答案(或任何其他答案),并通过允许任意翻译和缩放来将其扩展到位置范围的系列。西安关于参数数量的观点仍然成立。
ub

@whuber我认为这很困惑。Student-t本身将是一个更好的答案,而不是使用的极端答案而不指定它。事实上,这是d ˚F这是第三个参数。df=3,df
卡尔,

6

我想您是在问,来自相同位置范围族的两个随机变量是否可以具有相同的均值和方差,但至少有一个不同的较高矩。答案是不。

证明:令X 2是两个这样的随机变量。由于X 1X 2在相同的位置标度族中,因此存在一个随机变量X和实数a 1 > 0 a 2 > 0 b 1b 2,使得X 1 d = a 1 X + b 1X 2 d = a 2 XX1X2X1X2Xa1>0,a2>0,b1,b2X1=da1X+b1。由于 X 1 X 2具有相同的均值和方差,因此我们具有:X2=da2X+b2X1X2

  1. E[X1]=E[X2]a1E[X]+b1=a2E[X]+b2
  2. Var[X1]=Var[X2]a12Var[X]=a22Var[X]

如果,则X 1 = E [ X 1 ] = X 2 = E [ X 2 ]且概率为1,因此X 1X 2的较高矩均相等。因此我们可以假设Var [ X ] 0。使用此,(2)表示| 一个1 | = | 一个2 | 。以来Var[X]=0X1=E[X1]=X2=E[X2]1X1X2Var[X]0|a1|=|a2| a 2 > 0,实际上我们有 a 1 = a 2。反过来,上面的(1)现在意味着 b 1 = b 2。因此,我们有: E [ X k 1 ] = E [ a 1 X + b 1 k ] = E [ a 2 X + b 2 k ] =a1>0a2>0a1=a2b1=b2 对于任何 k,即 X 1 X 2的所有矩都相等。

E[X1k]=E[(a1X+b1)k]=E[(a2X+b2)k]=E[X2k],
kX1X2

1
(+1)我找不到这个答案的错。显然有人这样做,他们也发现我的错。我不明白这种无法解释的行为。
卡尔,

5
@卡尔这个答案是不正确的-这就是为什么它被否决了。西安已经提供了反例。
whuber

1
@whuber请参阅我在西安回答下的评论。我不同意他的意见,但没有不同意,因为他和你都有权提出你的意见,即使我认为这是不正确的。
卡尔

8
@Carl重新阅读此答案后,我需要收回原来的评估:这个答案是正确的(为此+1),它是正确的,因为它清楚地说明了它是如何解释原始问题的。(特别是,“位置范围族”有一个普遍但狭窄的概念,它仅由一个标准分布及其所有翻译和正比例缩放组成。)该信念的基础是对帖子中两个以上参数的引用。
ub

2
抱歉,如果我不太清楚,我感谢您花时间研究这个问题,但这不是我要的。
gioxc88

1

由于可以以多种方式解释问题,因此我将这个答案分为两部分。

  • 答:分发家庭。
  • B:位置比例分布族。

案例A的问题很容易由具有形状参数的许多系列来回答/展示。

与情况B的问题是,因为一个更困难半参数似乎是足够的(在位置指定位置和尺度R在和规模R>0),并且该问题变得两个参数是否可用于编码(多)形状以及其他。这不是那么简单。我们可以轻松得出特定的两个参数位置标尺系列,并演示您没有不同的形状,但是不能证明这是任何两个参数位置标尺系列的固定规则。

答:同一2参数分布族的两个不同分布可以具有相同的均值和方差吗?

答案是肯定的,并且已经可以使用明确提到的示例之一进行显示:标准化Gamma分布

归一化伽玛分布族

Z=XμσX伽马分布变量。Z的(累积)分布如下:

FZ(z;k)={0ifz<k1Γ(k)γ(k,zk+k)ifzk

其中γ是不完整的伽马函数。

因此,显然存在这样的情况,不同的Z1Z2(归一化伽玛分布族的分布)可以具有相同的均值和方差(即μ=0σ=1),但基于参数k(通常表示为'形状'参数)。这与伽马分布族不是位置尺度族这一事实密切相关。

B:同一个2参数位置标度分布族的两个不同分布是否可以具有相同的均值和方差?

我认为,如果仅考虑平滑族(平滑:参数的微小变化将导致分布/函数/曲线的微小变化),那么答案是否定的。但是这个答案不是那么简单,当我们使用更多的普通(非平滑)家庭时,我们可以说是的,尽管这些家庭仅在理论上存在而没有实际意义。

通过转换和缩放从单个分布生成位置范围族

从任何特定的单个分布中,我们都可以通过转换和缩放生成位置比例尺族。如果f(x)是单一分布的概率密度函数,则该家庭成员的概率密度函数将为

f(x;μ,σ)=1σf(xμσ)

对于可以以这种方式生成的位置范围的家庭,我们有:

  • 对于任何两个成员f(x;μ1,σ1)f(x;μ2,σ2)如果它们的平均值和方差是相等的,然后f(x;μ1,σ1)=f(x;μ2,σ2)

是否可以通过平移和缩放从单个成员分布生成所有两个参数位置尺度族的成员分布?

因此,转换和缩放可以将单个分布转换为位置范围族。现在的问题是相反的是否为真,以及是否每两个参数位置规模家族(其中参数θ1θ2不一定需要与位置重合μ和尺度σ)可以通过平移和缩放来描述那个家庭的单身成员。

对于诸如正态分布族之类的特定的两个参数位置尺度族,并不是很难表明可以根据上述过程(单个示例成员的缩放和平移)生成它们。

有人可能想知道是否有可能通过转换和缩放从单个成员中生成两个参数的位置比例系列。还是一个矛盾的说法:“两个参数的位置标度族可以包含两个具有相同均值和方差的不同成员分布吗?”,为此,该族必须多个子族的并集,每个子族都是通过翻译和缩放。

情况1:由两个变量参数化的广义学生t分布族

当我们使从一些映射时发生人为的例子R2R3基数-的-mathbbr和- mathbbr2),其允许自由地使用两个参数θ1θ2来描述由产生的多个亚家族的联合平移和缩放。

让我们使用(三个参数)广义的学生t分布:

f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(xμσ)2)ν+12

与三个参数改变如下

μ=tan(θ1)σ=θ2ν=0.5+θ1/π

然后我们有

f(x;θ1,θ2)=Γ(0.5+θ1/π+12)Γ(0.5+θ1/π2)π0.5+θ1/πθ2(1+10.5+θ1/π(xtan(θ1)θ2)2)0.5+θ1/π+12

它可能被认为是两个参数的位置比例系列(尽管不是很有用),只能通过单个成员的平移和缩放来生成。

情况2:由非零偏斜的单个分布的负缩放生成的位置比例系列

xf(x/b+a)b

顺利的家庭

f:R2R3可以完成工作的连续函数,例如Peano曲线)。

θ1θ2θ1θ2μσ

θ1=fθ1(μ,σ)θ2=fθ2(μ,σ)

fθ1(μ,σ)μσ

θ1θ1f(x;θ1)x


1
xf,b1fθR2R3.地图‘“这些问题’是他们不能是连续的,不会有任何统计学意义。
whuber

2
R2R3θθ

1
第二个项目符号是不正确的:它既不来自任何假设,也不属于位置范围族的定义。
ub

1
θiθixF(bx+a)F(a,b)R2b>0F

1
μσθ1θ2μσ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.