GLM的归一化变换的推导


15

如何是A()=duV1/3(μ)正火变换为指数族衍生?

Xh(X)κiith

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h(μ)σ4N+O(N3),
h(X)
  1. 我的第一个问题是关于算术的:我的泰勒展开式具有不同的系数,我不能证明他们放弃了许多项。

    Since h(x)h(μ)+h(μ)(xμ)+h(x)2(xμ)2, we have:h(X¯)h(u)h(u))(X¯μ)+h(x)2(X¯μ)2E(h(X¯)h(u))3h(μ)3E(X¯μ)3+32h(μ)2h(μ)E(X¯μ)4+34h(μ)h(μ)2E(X¯μ)5+18h(μ)3E(X¯μ)6.

    通过将中心矩替换为累积量等效项,我可以得到类似的结果,但它仍未累加。

  2. 第二个问题:为什么解析开始与X¯,而不是X,数量我们真正关心?


你似乎有u几次,你的意思是μ
Glen_b -Reinstate莫妮卡

Answers:


2

您链接到的幻灯片有些混乱,省略了步骤并做出了一些错别字,但最终都是正确的。这将有助于首先回答问题2,然后回答1,然后最终得出对称变换。A(u)=u1[V(θ)]1/3dθ

问题2。我们正在分析因为它是iid随机变量的大小的样本的。这是一个重要的数量,因为在科学中,对相同分布进行采样并取平均值一直都在发生。我们想知道与真实的平均值有多近。中心极限定理说它会收敛到为但是我们想知道的方差和偏度。 ÑX1XÑ ˉ X μμÑ→交通 ˉ XX¯NX1,...,XNX¯μμNX¯

问题1.您的泰勒级数逼近不是正确的,但是我们需要注意跟踪与和幂,才能得出与幻灯片相同的结论。我们将从的定义和中心矩开始,并得出的公式: XÑ ˉ X Xκ3ħ ˉ XX¯XiNX¯Xiκ3(h(X¯))

X¯=1Ni=1NXi

E[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]

现在,的中心时刻:X¯

E[X¯]=1Ni=1NE[Xi]=1N(Nμ)=μ

V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

由于,并且因此,执行最后一步。这可能不是的最简单推导,但是它是我们找到和所需的相同过程。,将总和的乘积分解并计算具有不同变量幂的项的数量。在上述情况下,有是那样的形式的条款和的形式的条款。ë [ X - μ 2 ] = σ 2 V ˉ Xκ 3ˉ Xκ 3ħ ˉ Xñ X - μ 2 ñ ñ - 1 X - μE[Xiμ]=0E[(Xiμ)2]=σ2V(X¯)κ3(X¯)κ3(h(X¯))N(Xiμ)2N(N1)(Xiμ)(Xjμ)

κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

接下来,我们将按照泰勒级数展开,如下所示:h(X¯)

h(X¯)=h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+13h(μ)(X¯μ)3+...

E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h(μ)E[(X¯μ)2]+13h(μ)E[(X¯μ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...

经过更多的努力,您可以证明其余术语为。最后,由于,(与),我们再次进行类似的计算:κ 3ħ ˉ X= È [ H ^ ˉ X- ë [ ħ ˉ X] 3 ] È [ H ^ ˉ X- H ^ μ 3 ]O(N3)κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(X¯)h(μ))3]

κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h(μ)σ2NO(N2))3]

我们只对产生顺序的术语感兴趣,通过额外的工作,您可能会发现您不需要术语“ ”或“ ”在获得三次幂之前,因为它们只会产生阶数。因此,简化,我们得到Ö ˉ X - μ 3- Ö ñ - 2Ö ñ - 3O(N2)O((X¯μ)3)O(N2)O(N3)

κ3(h(X¯))=E[(h(μ)(X¯μ)+12h(μ)(X¯μ)212h(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h(μ)3(X¯μ)618h(μ)3σ6N3+32h(μ)2h(μ)(X¯μ)4+34h(μ)h(μ)(X¯μ)532h(μ)2h(μ)(X¯μ)2σ2N+O(N3)]

我省略了一些显然是术语。您必须说服自己和是也是如此。然而,ë [ ˉ X - μ 5 ] È [ ˉ X - μ 6 ] ø ñ - 3O(N3)E[(X¯μ)5]E[(X¯μ)6]O(N3)

E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

然后分配我们的方程在预期,我们有κ3(h(X¯))

κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h(μ)E[(X¯μ)4]32h(μ)2h(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)

这样就得出。现在,最后,我们将导出对称变换。Û = Ü - 1κ3(h(X¯))A(u)=u1[V(θ)]1/3dθ

对于此转换,重要的是来自指数族分布,尤其是自然指数族(或已转换为该分布),形式为˚F X X ; θ = ^ h X EXP θ X - b θ XifXi(x;θ)=h(x)exp(θxb(θ))

在这种情况下,分布的累积量由。因此,和。我们可以将参数作为的函数编写,只需取的倒数,即。然后κk=b(k)(θ)μ=b(θ)σ2=V(θ)=b(θ)κ3=b(θ)θμbθ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2

接下来,我们可以将方差写为的函数,并将其称为:μV¯

V¯(μ)=V(θ(μ))=b(θ(μ))

然后

ddμV¯(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2

因此,作为的函数,。μκ3(μ)=V¯(μ)V¯(μ)

现在,对于对称变换,我们想通过使来减少的偏度因此为。因此,我们想要h(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(X¯)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0

将和表达式替换为函数,我们有:σ2κ3μ

h(μ)3V¯(μ)V¯(μ)+3h(μ)2h(μ)V¯(μ)2=0

因此导致。h(μ)3V¯(μ)+3h(μ)2h(μ)V¯(μ)=0ddμ(h(μ)3V¯(μ))=0

此微分方程的一种解决方案是:

h(μ)3V¯(μ)=1

h(μ)=1[V¯(μ)]1/3

因此,对于任何常数,。这给我们对称变换,其中是方差为自然指数族中均值的函数。h(μ)=cμ1[V¯(θ)]1/3dθcA(u)=u1[V(θ)]1/3dθV


1

为什么我无法通过非中心矩近似来得到相同的结果,矩使用近似非中心矩?EX¯kE(X¯EX¯)k

因为您可以任意更改推导并删除重要的残差项。如果您不熟悉大的O符号和相关结果,可以参考[Casella&Lehmann]。

h(X¯)h(u)h(u)(X¯μ)+h(x)2(X¯μ)2+O[(X¯μ)3]

E[h(X¯)h(u)]h(u)E(X¯μ)+h(x)2E(X¯μ)2+(?)

但是,即使您没有通过争论自己总是在进行(这是不合法的...)来丢弃残留物,也可以执行以下步骤: 表示N

\E(h(X¯)h(u))3h(μ)3\E(X¯μ)3+32h(μ)2h(μ)\E(X¯μ)4+34h(μ)h(μ)2\E(X¯μ)5+18h(μ)3\E(X¯μ)6.(1)
[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

如果还不清楚,我们可以看到扩展被积数的代数

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

令,,A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

您的错误是在扩展之前忽略残基,这是大O表示法中的“经典”错误,后来成为对大O表示法用法的批评。

ˉ X X为什么分析以而不是我们实际关心的开头?X¯X

因为我们要基于引入的指数模型的足够统计量进行分析。如果您有一个大小为1的样本,则是否使用或进行分析都没有区别。X1X¯=1ni=1nXiX1

尽管与GLM不相关,但这是一个很好的大O教训。

参考文献 [Casella&Lehmann] Lehmann,Erich Leo和George Casella。点估计理论。施普林格科学与商业媒体,2006年。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.