如何构建中位数之间差异的95%置信区间?


27

我的问题是:平行组随机试验的主要结局分布偏右。我不想假设正常,而是使用基于法线的95%CI(即使用1.96 X SE)。

我很乐意将集中趋势的度量表示为中位数,但是我的问题是,如何构建两组之间中位数差异的95%CI。

首先想到的是引导程序(用替换进行重采样,确定两组的中位数,并从另一组中减去一个,重复1000次,并使用偏差校正的95%CI)。这是正确的方法吗?还有其他建议吗?


3
那也是我想到的第一件事。您有多少样本?
jbowman 2012年

两组中的40人=共80人。
pmgjones 2012年

3
您可能会基于Hodges-Lehmann估计量,研究非参数置信区间和估计量,以获取位置参数的差异。如R的帮助页面wilcox.test()(在下方Details)所述,这与中位数的差异密切相关,但并不完全相同。
caracal 2012年

2
关于引导中值,可能值得阅读有关平滑的引导程序的信息。
caracal 2012年

@caracal:这是一个好点。常规或平滑的引导程序都具有正确的渐近覆盖范围,但是平滑的引导程序的覆盖范围概率会以更快的速度收敛。如果我没记错的话,(通常的引导程序),(平滑的引导程序)。对此进行了简短的讨论,并在Koenker(2005)的分位数回归中作了进一步的参考。ø ñ - 2 / 5|P(mI^n)0.95|=O(n1/3)Øñ-2/5
paul 2012年

Answers:


10

您描述的引导过程应该是有效的。但是,请务必牢记,就像基于法线的95%CI一样,自举置信区间只能保证渐近地具有正确的覆盖范围。使用中位数或其他分位数的一件好事是,您可以在非常弱的假设下构造精确的有限样本置信区间。基本思想是,在中位数为的零值下,的指标是伯努利0.5随机变量。您可以使用此观察值来创建具有已知有限样本分布的测试统计量。有关更多详细信息请参见Chernozhukov,Hansen,Jansson(2009)m y < mÿmÿ<


1
您能否解释一下它只是渐近有效的意思?我不确定在这种情况下渐近意味着什么。谢谢!
pmgjones 2012年

@pmgjones:对于某些参数,95%的置信区间使得 所有可能的(或实际上所有可能的数据生成过程)的。我写了来强调间隔是您样本的某些功能。对于自举或基于普通的置信区间,(非常特殊的数据生成过程除外并不正确。但是,您可以证明。我的意思是说引导程序仅在渐近范围内有效。P Ñ=0.95 ÑP Ñ=0.95LIMÑ→交通P Ñ=0.95一世^ñP一世^ñ=0.95一世^ñP一世^ñ=0.95ñP一世^ñ=0.95
paul 2012年

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.