在已知回归系数的情况下更容易首先进行工作,因此零假设很简单。那么足够的统计量是,其中是残差;它在零值下的分布也是由缩放的卡方,自由度等于样本大小。T=∑z2zσ20n
写下和下的似然比,并确认对于任何,它都是的递增函数:σ=σ1σ=σ2Tσ2>σ1
对数似然比函数为,当时,&与正成正比,并且与成正比。
ℓ(σ2;T,n)−ℓ(σ1;T,n)=n2⋅[log(σ21σ22)+Tn⋅(1σ21−1σ22)]
Tσ2>σ1
因此,根据Karlin-Rubin定理,每个单尾检验与&与是最强大的。显然,没有针对与的UMP测试。作为讨论在这里,开展两单尾测试和两个尾部与同样大小的拒绝区将多比较,纠正导致常用的测试,和它的时候你会要求要么是比较合理的或拒绝空值时的。H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ≠σ0σ>σ0σ<σ0
接下来找到的最大似然估计和&的似然:σ=σ^σσ=σ0
由于,对数似然比检验统计量为σ^2=Tn
ℓ(σ^;T,n)−ℓ(σ0;T,n)=n2⋅[log(nσ20T)+Tnσ20−1]
对于量化对于这是一个很好的统计数据。由似然比检验反演形成的置信区间具有吸引人的特性,即区间内的所有参数值都比区间外的所有参数值具有更高的似然性。对数似然比的两倍的渐近分布是众所周知的,但是对于精确的测试,您无需尝试计算其分布-只需使用每个尾部中对应值的尾部概率即可。HA:σ≠σ0H0:σ=σ0T
如果您不能拥有一个功能最强大的测试,那么您可能想要一个对最接近null的替代品最强大的测试。找到关于的对数似然函数的导数-得分函数:σ
dℓ(σ;T,n)dσ=Tσ3−nσ
评估处的可对与进行局部最有力的测试。因为测试统计量的范围在下面,所以在样本较少的情况下,拒绝区域可能会局限于上尾。同样,平方分数的渐近分布是众所周知的,但是您可以使用与LRT相同的方法来获得精确的检验。σ0H0:σ=σ0HA:σ≠σ0
另一种方法是将您的注意力限制在无偏测试上,即那些在任何替代方法下的能力超出其规模的测试。检查您的足够统计量在指数族中是否存在分布;然后对于大小为测试,如果或,否则为,则可以通过解决来找到统一性能最强的无偏测试
φ (Ť )= 1 Ť < ç 1 Ť > c ^ 2 φ (Ť )= 0 È (φ (Ť ))αϕ(T)=1T<c1T>c2ϕ(T)=0
E(ϕ(T))E(Tϕ(T))=α=αET
绘图有助于显示等尾区域测试中的偏差及其产生方式:
在值略高于的情况下,测试统计数据落入上尾拒绝抑制的概率增加,但不能弥补其下降到下尾拒绝区域的概率降低以及测试跌落到其尺寸以下。σ 0σσ0
保持公正是好的。但是,在替代方案中,在参数空间的一小部分区域内具有略低于大小的幂的功效实在是太糟糕了,以至于完全排除了测试,这并不是不言而喻的。
上述两尾测试中的两个是重合的(对于这种情况,不是一般情况):
在无偏测试中,LRT是UMP。如果情况并非如此,那么LRT可能仍会渐近无偏。
我认为,即使是单尾测试,也可以接受,也就是说,没有一种测试在所有替代方法下都比其他方法更强大或更强大—您可以使测试在一个方向上对替代品的功能更强大,而只有在使测试对另一种替代品的功能不那么强大时,方向。随着样本量的增加,卡方分布变得越来越对称,并且所有的双尾检验最终都将是相同的(另一个使用简单的等尾检验的原因)。
使用复合零假设,论点变得更加复杂,但是我认为您可以从细节上作必要的修改而获得几乎相同的结果。请注意,单尾测试中的一个而不是另一个是UMP!