为什么我们要稳定方差?


15

在阅读Kaggle Essay Eval方法时,我遇到了方差稳定化转换。他们使用方差稳定化变换对kappa值进行变换,然后取平均值,然后将其变换回去。即使阅读了我无法理解的关于方差稳定化变换的Wiki,为什么我们实际上仍能稳定方差呢?我们从中获得什么好处?


6
通常,其目的是使(渐近)方差与感兴趣的参数无关。这在推论中特别重要,在推论中,我们需要知道参考分布以计算相关的感兴趣量。
主教

Answers:


13

这是一个答案:通常,进行统计推断的最有效方法是何时对数据进行仿制。另一种查看方式是,如果您可以在推断中添加额外的信息(即,通过方差稳定化转换来实现方差的函数形式),通常至少会渐近地提高估计的准确性。在非常小的样本中,打扰方差建模可能会增加您的小样本偏差。这是一种计量经济学的GMM类型的参数:如果添加其他矩,则渐近方差就不会增加;并且您的有限样本偏差会随着过度确定的自由度而增加。

红衣主教给出了另一个答案:如果您的渐近方差表达式中存在未知方差,则渐近分布上的收敛速度会变慢,并且您必须以某种方式估计该方差。预先透视数据或统计数据通常有助于提高渐近近似的准确性。


我想我理解您回答中的第一句话,并且凭直觉吸引了我。我可以用谷歌搜索这个名字吗?我想找到一些思想实验或示例,来说明当您在不同的观察结果中拥有不同数量的信息时会发生什么,以及这种效率如何低下
Pushpendre

Korn&Graubard(1999)关于调查统计的文章对此进行了讨论。
StasK

f1(1nif(κi))

@PushpendreRastogi,您可能想阅读有关这种转换的维基百科文章。它是由Fisher引入的,用于稳定经验相关系数(在正常变量之间)的方差。在这种情况下,变换后的变量将近似于正态,方差仅取决于样本大小,而不取决于未知的相关系数(这就是为什么“稳定”方差的原因)。
猫王

@Elvis,我在有关关键统计的Wikipedia文章(en.wikipedia.org/wiki/Pivotal_statistic)中给出了相关示例。[您究竟如何在评论中提供漂亮的链接?我尝试了href,它看起来很丑。]
StasK 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.