可靠的均值t检验


17

我正在尝试针对随机变量(针对该变量的轻度到中度偏斜和峰度),针对局部替代测试零。遵循Wilcox在“稳健估计和假设检验简介”中的建议之后,我基于修整后的均值,中位数以及位置的M估计值(Wilcox的“一步”过程)对测试进行了研究。在使用非偏斜但具有正态分布的分布进行测试时,就功率而言,这些强大的测试确实优于标准t检验。E[X]=0E[X]>0X

但是,当使用偏斜的分布进行检验时,根据原假设,这些单面检验要么过于宽松,要么过于保守,这分别取决于该分布是左偏斜还是右偏斜。例如,对于1000个观察值,基于中位数的测试实际上将拒绝〜40%的时间,即名义5%的水平。原因很明显:对于偏斜的分布,中位数和均值是完全不同的。但是,在我的应用程序中,我确实需要测试均值,而不是中位数,而不是修整后的均值。

是否有t检验的更强大版本可以实际测试均值,但不能偏斜和峰度?

理想情况下,该程序在无偏斜,高峰度的情况下也能很好地工作。“单步”测试几乎足够好,“弯曲”参数设置得较高,但是在没有偏斜的情况下,它不如经过修剪的均值测试强大,并且在保持偏斜下的废品标称水平方面有些麻烦。

背景:我真正关心平均值而不是平均值的原因是,该测试将用于金融应用程序。例如,如果您想测试某个投资组合是否具有正的预期对数回报,则该平均值实际上是适当的,因为如果您投资该投资组合,您将体验到所有的回报(这是平均值乘以样本数),而不是中位数的重复项。也就是说,我真的很在乎RV的和。nnX


是否有禁止使用Welch t检验的原因?看看我对这个问题的回答(stats.stackexchange.com/questions/305/…),在这里我指的是一篇提倡在非正态和异方差情况下使用Welch的论文。
亨里克

1
Ë[X]=μË[X1个]=Ë[X2]

感谢您的澄清。在这种情况下,Kubinger论文将对您没有太大帮助。对不起。
亨里克(Henrik)2010年

Answers:


5

为什么要查看非参数测试?是否违反了t检验的假设?即是序数数据还是非正态数据,并且方差不变?当然,如果样本足够大,尽管样本中缺乏正态性,您也可以用其更大的能力证明参数t检验的合理性。同样,如果您关注的是方差不均等,则可以对参数测试进行更正以产生准确的p值(Welch校正)。

否则,将您的结果与t检验进行比较不是解决问题的好方法,因为当不满足假设时,t检验的结果就会产生偏差。如果您确实需要Mann-Whitney U,则它是一个合适的非参数替代方案。仅当您可以合理地使用t检验(因为满足假设)时才使用非参数检验时,才失去功率。

而且,只是为了获得更多背景信息,请转到此处...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


数据绝对是不正常的。过量峰度约为10-20,偏斜约为-0.2至0.2。我正在做一个1样本t检验,所以我不确定我是否关注“不均等方差”或U检验。
shabbychef

我接受“使用参数测试”建议。它不能完全解决我的问题,但我的问题可能太开放了。
shabbychef 2010年

12

我同意,如果您要实际检验组均值是否不同(而不是检验组中位数或修整均值之间的差异等),那么您就不想使用检验不同假设的非参数检验。

  1. 通常,在假设残差正态性假设适度偏离的情况下,来自t检验的p值往往相当准确。查看此applet,以直观了解这种鲁棒性:http : //onlinestatbook.com/stat_sim/robustness/index.html

  2. 如果您仍然担心违反正常性假设,则可能需要bootstrap。例如,http : //biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. 您还可以变换偏斜的因变量来解决偏离正常值的问题。


2
+1清晰明确的答案。杰罗米病,我可以问关于第3点的问题吗?我确实了解转换数据背后的原因,但是这样做总是让我感到困扰。将转换后的数据的t检验结果报告给未转换的数据(在此情况下,您“不允许”进行t检验)的有效性是什么?换句话说,如果在对数据进行日志转换时两组不同,例如,您可以根据什么说原始数据也不同?切记,我不是统计学家,所以也许我只是说了些绝对愚蠢的事情:)
nico 2010年

2
@nico我不确定如何报告或考虑结果,但是如果您只想显示对于某些X和Y,mu_X!= mu_Y,则对于所有X_i <X_j,log( X_i)<log(X_j),并且对于所有X_i> X_j,log(X_i)> log(X_j)。这就是为什么对于按等级运行的非参数测试,数据的转换不会影响结果。我认为,您可以假设,如果某些测试显示mu_log(X)!= mu_log(Y),那么mu_X!= mu_Y。
2010年

感谢您的回答。实际上,在轻度偏斜/峰态输入下,t检验似乎可以维持名义I型比率。但是,我希望有更多的功能。回复:2,我已经实现了Wilcox' trimpbtrimcibt,但是它们进行我的功率测试有点太慢了,至少对于我而言。回复:3,我曾经想到过这种方法,但是我对未转换数据的均值感兴趣(即,我没有用t检验比较2个RV,在这种情况下,单调转换对于@JoFrhwld指出的基于排名的比较。)
shabbychef,2010年

2
@nico如果两个组中残差的总体分布相同,那么我可以想象,原始种群组中的任何时候都存在差异,这意味着保序转换的组均值也将存在差异。就是说,根据您使用的是原始数据还是转换后的数据,p值和置信区间往往会略有变化。通常,我更喜欢在看起来像是理解变量的有意义度量的情况下使用转换(例如,里氏标度,分贝,计数对数等)。
Jeromy Anglim


0

我没有足够的声誉来发表评论,因此作为回答:看一下这个计算。我认为这提供了一个很好的答案。简单来说:

渐近性能对偏斜形式的偏离正常性的敏感度要比峰度形式敏感得多。因此,学生的t检验对偏斜敏感,但对重尾巴则相对稳健,因此对于在应用t检验之前针对偏斜替代的正态性。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.