是否有任何参数和非参数统计检验?


20

是否有任何参数和非参数统计检验?采访小组提出了这个问题。这是有效的问题吗?


1
研究维基百科条目上的非参数统计信息可能足以为您准备一名面试官。您可以用一个问题来回答该问题,例如“非参数是什么意思?无分布模型或等级统计?”
jrhorn424

3
作为出发点,它可能会帮助您以及您的答复者向有关定义的权威机构(不是 Internet!)咨询。“ 参数情况 ...都是可以用矢量\ theta表示所有[自然状态]类的例子,其中矢量\ thetaθ由有限数量的实数组成。和损失函数依赖于θ在一个合理平稳的方式)所有其他问题都调用。非参数 --jC基弗。介绍统计推断, p 23。
whuber

一位教授告诉我,“卡方检验”具有两种行为(即参数化和非参数化)。我根本不了解,为什么“卡方检验”同时具有这两种行为。
Biostat 2011年

3
测试不是参数化的,而是模型。在两种情况下都出现卡方分布(在具有正态分布假设的一般线性模型中以自然的方式出现,并且作为对数似然差的近似值(均为参数应用),也作为多项式的近似值分布出现在许多非参数应用程序中),因此有许多不同的测试共享“卡方”的名称。这可能是建议您的教授发表评论的原因。
ub

@whuber:您的最后评论是否意味着卡普尔检验拟合优度是非参数的?
蒂姆(Tim)

Answers:


6

从根本上讲,很难确切地说出“参数测试”和“非参数测试”的含义,尽管有许多具体的例子,其中大多数人会同意测试是参数测试还是非参数测试(但绝不会两者同时使用) 。快速搜索给出了这张,我认为它代表了参数测试和非参数测试在某些领域的常见实际区别。

在所引用的表格上方有一个备注:

“……参数数据具有潜在的正态分布……。其他任何东西都是非参数的。”

在某些情况下,我们假设正态性并使用ANOVA,并且这是参数化的,或者我们不假设正态性并使用非参数性选择,这可能是一个公认的准则。

在我看来,这可能不是一个很好的定义,也不是正确的,但这可能是一个实用的经验法则。这主要是因为在社会科学的最终目标,比如说,是分析数据,有什么好的是它能够制定基于非正态分布的参数模型,然后能够分析数据?

另一种定义是将“非参数检验”定义为不依赖于分布假设的检验,而参数检验则不依赖于其他任何检验。

所呈现的前者和后者定义定义了一类测试,然后将另一类定义为补充(其他)。根据定义,这排除了测试可以是参数性的也可以是非参数性的。

事实是,后者的定义也是有问题的。如果可以施加某些自然的“非参数”假设,例如对称性,该怎么办?这是否会将不依赖任何分布假设的检验统计量转换为参数检验?大多数人会拒绝!

因此,非参数测试类别中的某些测试可以进行一些分布假设只要它们不是“过于参数化”即可。“参数”测试与“非参数”测试之间的界限已经变得模糊,但是我相信大多数人会坚持认为测试是参数测试还是非参数测试,也许不能说这两者都是毫无意义。-

从不同的角度来看,许多参数测试是(相当于)似然比测试。这使一般理论成为可能,并且我们对在适当的规则性条件下似然比检验的分布特性有了统一的了解。相反,非参数检验本身 并不等同于似然比检验不存在似然如果没有基于似然性的统一方法,我们就必须根据个案推导分布结果。经验似然理论--但是,主要由斯坦福大学的Art Owen开发的折衷方案非常有趣。它提供了一种基于似然度的统计方法(对我来说很重要,因为我认为似然度是一个比值更重要的对象),而无需典型的参数分布假设。基本思想是在经验数据上巧妙地使用多项式分布,这些方法非常“参数化”,但在不限制参数化假设的情况下仍然有效。p

恕我直言,基于经验似然的测试具有IMHO的优点和非参数测试的普遍性,因此,在我能想到的测试中,它们最有资格同时具有参数和非参数资格,尽管我会不使用此术语。


+1非常有趣的评论。就边界变得“模糊”而言,我认为这是对感知的正确陈述但是定义本身并没有模糊性:参数和非参数之间的区别与有限之间的区别一样清晰,清晰。和无限。
ub

@whuber,关于什么是“模糊的”,我具体指的是非参数测试也可以有分布假设的事实,因此我的第二个定义也不起作用。如果我要尝试一个清晰的定义,则参数测试基于可以由有限维欧几里德空间的子集参数化的模型。我认为最“模糊”的是,对于我来说,不清楚在非参数假设与参数假设一样成为问题之前,您离“没有分布假设”还有多远。
NRH

@whuber,我现在阅读您关于基弗的问题评论,是的,向权威机构进行正式定义绝对是一个好主意!实际上,我实际上更关心人们说“非参数”时的一般含义,而且我想很少有人想到过基弗的定义。
NRH

请参阅我对基弗(Kiefer)的报价,以评论原始问题。特别地,“非参数”并不意味着“没有分布假设”。相反,最著名的非参数检验做出了分布假设。我想我确实理解您的“模糊”感:出于这种考虑,我选择了有限/无限类比,因为在实践中,非常多(但有限)的参数也可能被认为是无限的。
ub

2

参数化(至少)具有两种含义:A-要声明,您假设噪声分布族取决于其参数。B-声明您假设解释变量和结果之间存在特定的功能关系。

一些例子:

  • 具有线性链接的分位数回归将被视为B参数和A非参数。
  • 具有高斯噪声的时间序列的样条平滑可以质量为A非参数和B参数。

术语“半参数”通常是指情况B,意味着您没有假设整个函数关系,而是拥有较温和的假设,例如“在预测变量的某种平滑转换中加法”。

您也可以对噪声的分布有较温和的假设,例如“所有力矩都是有限的”,而无需特别指定分布的形状。据我所知,这种假设没有术语。

请注意,答案与数据生成过程背后的基本假设有关。当说“ a-parametric test”时,通常指意义A中的非参数。这就是您的意思,那么我会回答“ no”。同时具有相同意义的参数化和非参数化是不可能的。


第一段中的两个含义在文献中经常被统一对待:也就是说,它们之间似乎没有根本或重要的区别。顺便说一句,“所有时刻都是有限的”情况绝对是一个非参数问题。
ub

@whuber:Keifer中的定义似乎涵盖了这两种情况(我承认,我从未读过它,而且我还在寻找例外情况)。另一方面,术语确实会改变其含义。“经验贝叶斯”不再意味着罗宾斯在1955年所使用的含义。您不能忽略一个事实,即存在着不止一种解释。
JohnRos

好的,但是我们应该有点挑剔:“参数”和“非参数”的许多解释和尝试定义显然是无知而不是理解的表达。您是否可以引用一个清晰​​,严谨和权威性的替代定义(准确地说,是权威性的可靠的同行评审期刊会毫无疑问接受的权威性)?
ub

1
@whuber:我接受挑战!:-)尽管要注意,由于所有研究人员都开始在Wikipedia中进行查找,因此可靠的同行评审期刊与Wiki定义保持一致是一个时间问题。(“如果您无法击败他们……”)
JohnRos

1
维基百科的文章,从1940年的,谁不仅是第一个使用引号沃尔福威茨“非参数”,但也基弗的直接祖先智慧的一个。我认为我们不会在那找到任何真正的区别。(基弗只增加了关于损失函数的技术要求。)但是,我怀疑很少有(如果有的话)真正的研究人员将Wikipedia作为出发点,尤其是在没有数学基础的领域!
ub

1

我想这取决于它们的“参数和非参数”含义吗?完全同时还是两者混合?

许多人认为Cox比例风险模型是半参数的,因为它没有参数估计基线风险。

或者,您可以选择将许多非参数统计信息视为实际上是大量参数。


7
这似乎是躲闪。问题是探究是否欣赏“参数”和“非参数”之间的区别,无论它是否明确。一个好的答案将阐明这种区别,而不是使之混淆。
ub

1
@whuber哪个“问题”?面板还是OP?因为在我看来,OP并没有探索任何区别。然后,这取决于人们在哪里划清界限。我不认为为“嗯,这取决于”提供一个通用的和哲学的例子是躲闪。我认为这是一个答案。就像是想将“参数”视为完全参数化,还是仅具有参数。
Fomite 2011年

关于“哪个问题”的观点是好的。我认为我开始对您的答复感到有些麻烦的地方是,根据我的资源,这种区分是没有意义的(“混合”是毫无意义的,以及“统计”可以参数化的想法),这表明您使用的“参数”和“非参数”定义与我使用的定义不同。尽管您明确指出答案必须取决于这些术语的含义,但实际上并没有提供定义以使您的后续注释清晰或易于理解。
ub

@whuber还算公平。我发现最初的问题有点荒谬,所以我会尽力而为。现在,这个问题有了更好的答案,对OP的含义做出了一些假设。
Fomite

0

布拉德利(Bradley)在其经典的《无分布统计检验》(1968年,第15–16页-参见报价问题)中阐明了无分布检验与非参数检验之间的区别,他说这常常相互混淆,并给出了参数无分布测试的示例,作为中位数的符号测试。该测试不假设变量值的抽样总体的基本分布,因此它是无分布的。但是,如果所选的中位数正确,则应以相同的概率选择高于或低于该数值的值,并p=0.5

更新资料

一种¬一种


1
我喜欢这个答案的开头,因为它做出了有趣的区分,并提供了很好的参考。但是,在我看来,答案的其余部分使关于数据的假设与检验统计量的属性混淆了。符号测试的假设确实是“无发行的”。但是,检验统计量的抽样分布是二项式的事实是一个完全独立的问题,不会使过程成为参数!
whuber

好吧,布拉德利本人在第15页上将Sign测试称为免发行但参数化。注释框太小,无法完整地包含两个关键句子。请阅读其他答案,特别是以“粗略地说……”和“为了完全清楚……”开头的句子。谢谢。
阿夫拉罕(Avraham)2014年

如果布拉德利就是这种情况,那么自那以后这些术语的含义就已经改变了,或者(我讨厌这么说)您误解了他所写的内容。(我无法访问我可以检查的副本。)现在(在过去至少30年中也没有)绝对不是这种情况,“参数”是指检验统计量的分布。请参阅Wikipedia文章中的Wolfowitz语录。
ub

2
FΩθ

2
值得一提的是,我看了另外两本统计书,DeGroot的《概率与统计》(第二版,第520-521页)和拉森的《概率论与统计推断简介》(第三版,第508-509页),都使用了我认为,术语参数化是指Bradly所谓的“无发行”,就像Kiefer一样。因此,要回答OP,取决于您如何定义“参数”。
Avraham 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.