没有UMP时如何定义拒绝区域?


13

考虑线性回归模型

y=Xβ+u

uN(0,σ2I)

E(uX)=0

设与。ħ 1σ 2 0σ 2H0:σ02=σ2H1:σ02σ2

我们可以推导出,其中。并且是灭者矩阵的典型表示法,其中是因变量在上回归了。ð中号X=Ñ×ķ中号X中号XŶ= ÿ ÿ ÿXyTMXyσ2χ2(nk)dim(X)=n×kMXMXy=y^y^yX

我正在阅读的书指出: 在此处输入图片说明

之前,我曾问过应该使用什么标准来定义拒绝区域(RR),请参阅此问题的答案,主要的是选择使测试尽可能强大的RR。

在这种情况下,备选方案是双边复合假设,通常不需要UMP检验。而且,根据书中给出的答案,作者没有显示他们是否研究了RR的功能。尽管如此,他们还是选择了两尾RR。为什么会这样,因为该假设没有“单方面”确定RR?

编辑:此图像作为练习4.14的解决方案,在本书的解决方案手册中。



@Scortchi感谢您的链接。我可以问您一些关于这个问题的事情吗?你觉得有趣吗?我正在尝试评估我是否正在提出有趣的问题,或者是否应该将自己的兴趣转移到其他地区……
一位海上老人。

当然,并非所有人都认为理论很有趣,但是有些人(包括我在内)确实对我们感兴趣,并且我们用标记了将近2k qsmathematical-statistics。所以,很好。海事组织。它有点宽泛,但我认为一个很好的答案将概述各种方法和注意事项,而一个激励人心的例子会有所帮助。(尽管我已经选择了一个尽可能简单的示例-测试已知均值或指数分布均值的正态分布方差。)[顺便说一句,当我对qs进行评论时,我常常忘记对qs投票。]
Scortchi-恢复莫妮卡

@Scortchi感谢您的反馈。有时我不确定自己的问题结构是否合理,因为我正在自我研究。
一位老人在海里。

2
您应该定义MX
泰勒

Answers:


7

在已知回归系数的情况下更容易首先进行工作,因此零假设很简单。那么足够的统计量是,其中是残差;它在零值下的分布也是由缩放的卡方,自由度等于样本大小。T=z2zσ02n

写下和下的似然比,并确认对于任何,它都是的递增函数:σ=σ1σ=σ2Tσ2>σ1

对数似然比函数为,当时,&与正成正比,并且与成正比。

(σ2;T,n)(σ1;T,n)=n2[log(σ12σ22)+Tn(1σ121σ22)]
Tσ2>σ1

因此,根据Karlin-Rubin定理,每个单尾检验与&与是最强大的。显然,没有针对与的UMP测试。作为讨论在这里,开展两单尾测试和两个尾部与同样大小的拒绝区将多比较,纠正导致常用的测试,和它的时候你会要求要么是比较合理的或拒绝空值时的。H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σσ0σ>σ0σ<σ0

接下来找到的最大似然估计和&的似然:σ=σ^σσ=σ0

由于,对数似然比检验统计量为σ^2=Tn

(σ^;T,n)(σ0;T,n)=n2[log(nσ02T)+Tnσ021]

对于量化对于这是一个很好的统计数据。由似然比检验反演形成的置信区间具有吸引人的特性,即区间内的所有参数值都比区间外的所有参数值具有更高的似然性。对数似然比的两倍的渐近分布是众所周知的,但是对于精确的测试,您无需尝试计算其分布-只需使用每个尾部中对应值的尾部概率即可。HA:σσ0H0:σ=σ0T

如果您不能拥有一个功能最强大的测试,那么您可能想要一个对最接近null的替代品最强大的测试。找到关于的对数似然函数的导数-得分函数:σ

d(σ;T,n)dσ=Tσ3nσ

评估处的可对与进行局部最有力的测试。因为测试统计量的范围在下面,所以在样本较少的情况下,拒绝区域可能会局限于上尾。同样,平方分数的渐近分布是众所周知的,但是您可以使用与LRT相同的方法来获得精确的检验。σ0H0:σ=σ0HA:σσ0

另一种方法是将您的注意力限制在无偏测试上,即那些在任何替代方法下的能力超出其规模的测试。检查您的足够统计量在指数族中是否存在分布;然后对于大小为测试,如果或,否则为,则可以通过解决来找到统一性能最强的无偏测试 φ Ť = 1 Ť < ç 1 Ť > c ^ 2 φ Ť = 0 È φ Ť αϕ(T)=1T<c1T>c2ϕ(T)=0

E(ϕ(T))=αE(Tϕ(T))=αET

绘图有助于显示等尾区域测试中的偏差及其产生方式:

针对替代品的测试能力图

在值略高于的情况下,测试统计数据落入上尾拒绝抑制的概率增加,但不能弥补其下降到下尾拒绝区域的概率降低以及测试跌落到其尺寸以下。σ 0σσ0

保持公正是好的。但是,在替代方案中,在参数空间的一小部分区域内具有略低于大小的幂的功效实在是太糟糕了,以至于完全排除了测试,这并不是不言而喻的。

上述两尾测试中的两个是重合的(对于这种情况,不是一般情况):

在无偏测试中,LRT是UMP。如果情况并非如此,那么LRT可能仍会渐近无偏。

我认为,即使是单尾测试,也可以接受,也就是说,没有一种测试在所有替代方法下都比其他方法更强大或更强大—您可以使测试在一个方向上对替代品的功能更强大,而只有在使测试对另一种替代品的功能不那么强大时,方向。随着样本量的增加,卡方分布变得越来越对称,并且所有的双尾检验最终都将是相同的(另一个使用简单的等尾检验的原因)。

使用复合零假设,论点变得更加复杂,但是我认为您可以从细节上作必要的修改而获得几乎相同的结果。请注意,单尾测试中的一个而不是另一个是UMP!


Scortchi感谢您的回答。我仍然有一些疑问。首先,您能否详细说明以下句子?«应用多重比较校正会导致常用的测试在两个尾部具有相等大小的拒绝区域,并且当您拒绝零值时要求σ>σ0或σ<σ0时,这是非常合理的。» 还有为什么你说这合理呢?如果我没有记错的话,我认为这是我问题的核心。;)
一位老人在海中。

我从您的链接答案中阅读了此段落,但我不太理解«将最低的单尾p值加倍可以看作是进行两个单尾测试的多次比较校正。» 如果您能再解释一点,我将不胜感激。;)
一位老人在海中。

参见Bonferroni校正。如果您执行两个单独的大小测试,则按家庭划分的Type I错误不会超过,并且当拒绝区域不相交时,则恰好是。我想指出的是,以这种方式可以看到均等面积测试,因为人们有时似乎认为使用它的唯一原因是易于计算和与其他测试近似。实际上,每个测试都有其自身的原理:因此,我不会说这是您问题的核心。这是课程的问题。α αα/2αα
Scortchi-恢复莫妮卡

1

在这种情况下,备选方案是双边复合假设,通常不需要UMP检验。

我不确定这是否普遍。当然,许多经典结果(Neymon-Pearson,Karlin-Rubin)都基于简单或单面假设,但确实存在对两面复合假设的概括。您可以在此处找到一些注释,并在教科书中找到更多讨论。

具体来说,对于您的问题,我不知道是否存在UMP测试。但是从直觉上讲,似乎是在0-1损失下,单面测试可能是不可接受的,因此,可接受的测试类别将是所有双面测试。给出两面测试的类,目标是找到具有最大功效的一种,这应该通过在的一种模式周围选择分位数来自动进行。(这都是基于直觉的)。χ2


3
在这种情况下,显然没有统一的最强大的测试,因为存在针对不同方向针对特定替代方案的最强大测试。对于以能力定义的“最佳”测试,您必须寻找所有无偏测试所有不变测试中统一最强大的测试;或进行本地最强大的测试;或类似的内容-可能最终会接受任何可接受的测试。σ0
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.