什么是可靠的统计检验?什么是功能强大的统计检验?


14

一些统计测试是可靠的,而某些则不是。鲁棒性到底是什么意思?令人惊讶的是,我在此站点上找不到这样的问题。

此外,有时会一起讨论测试的鲁棒性和强大性。从直觉上讲,我无法区分这两个概念。什么是强大的测试?它与强大的统计检验有何不同?


2
功率和鲁棒性是正交的概念,即使它们是测试的两个重要属性也是如此。在我看来,最好提出两个单独的问题。
Stephan Kolassa,

2
我们可以将健壮性称为适应过程的属性,该过程对违反其核心理论的某些假设不敏感。
Firebug

Answers:


21

健壮性在统计数据中具有多种含义,但均暗示着对所使用的数据类型的更改具有一定的恢复能力。这听起来可能有点模棱两可,但这是因为健壮性可以表示对变化不敏感的不同种类。例如:

  • 异常值的鲁棒性
  • 鲁棒性非正常
  • 非恒定方差(或异方差)的稳健性

对于测试而言,健壮性通常是指在进行此类更改后测试仍然有效。换句话说,只有在满足测试假设的情况下,结果才有意义才有意义。如果放宽了这些假设(即不那么重要),则该测试是可靠的。

测试的能力在于,如果存在真正的差异,它就能检测出明显的差异。将特定的测试和模型与各种假设一起使用的原因是,这些假设简化了问题(例如,需要较少的参数进行估计)。测试做出的假设越多,其健壮性就越差,因为必须满足所有这些假设才能使测试有效。

另一方面,假设较少的测试则更可靠。但是,鲁棒性通常是以功耗为代价的,因为要么使用了来自输入的较少信息,要么需要估计更多参数。


Ť

Ť


FF


1
您的答案非常清楚且易于理解。我按问题进行了编辑,以询问有关测试是否powerful如我所见所讨论的更多问题。您介意解释功能强大的测试的含义吗?
JetLag

我简要介绍了这与测试功能之间的关系。
弗朗斯·罗登堡

1
这是一个很好的答案,只是想补充一下,有一些方法可以使定义形式化。一些人认为测试具有鲁棒性,如果它既具有有效性鲁棒性(即,在距零值很小的偏离下,测试的显着性水平是稳定的),又具有效率鲁棒性(即在与指定的替代方案相距很小的情况下,功率仍然很好);这些品质可以通过影响函数来量化。
弗朗西斯

1
@Eric,对等是否仅适用于两组?
Sextus Empiricus

1
F

3

“稳健的统计检验”没有正式的定义,但是对于这意味着什么有某种普遍的共识。Wikipedia网站对此有一个很好的定义(根据统计信息而不是测试本身):

稳健的统计数据对于从各种概率分布中得出的数据(尤其是对于非正态分布的数据)具有良好的性能。

https://zh.wikipedia.org/wiki/Robust_statistics

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.