在原假设下,可交换样本背后的直觉是什么?


15

排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。

您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。

注意:
提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。

更新:
假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。
现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较:
-将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较?
-将具有特征A的对象与具有V2的特征B的对象进行比较?
-比较在V2具有特征A的对象与在V3具有特征A的对象?
-在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
假设每次观察时都在一张单独的活页纸上,当我将纸叠交给您时,我滑了下来,并且当它们落在地板上时,它们四面八方地飞了出来。如果这破坏了您希望对这些数据执行的测试的有效性,那将是可耻的。如果您的意见是可以交换的,并且您正在基于此进行测试,那么您可以安慰我,并告诉我不要担心,同时可以帮助我从地板上收集论文。如果不是这样,并且数据收集特别昂贵,我可能需要为之奋斗。
2013年

2
另一方面,顺序对于时间序列数据(一般而言)确实很重要,并且测试通常应以适当的方式遵守此顺序。
主教

@cardinal,虽然您的直觉故事生动地描绘了这种假设的模样,但对于如何判断掉落的珍贵论文是否可以互换,我仍然感到困惑。如果可能,您可能会发表其他评论!
博士学位

Answers:


7

FXÿžX=1个ÿ=3ž=2=FXÿžX=3ÿ=2ž=1个等)。如果不是这种情况,那么计数排列不是检验原假设的有效方法,因为每个排列将具有不同的权重(概率/密度)。置换测试取决于给定的一组给定数值的变量的分配,这些变量具有相同的密度/概率。

FX1个=1个X2=2X3=3 ...Xñ=ñFX1个=ñX2=ñ-1个X3=ñ-2 ...Xñ=1个


+1,尽管可互换性得到了很好的解释,但我还是偶然发现,试图将jars隐喻应用于手头的研究。(请参阅问题的更新)。给定访问的持续时间以及基于功能的分组,我如何判断这些值的比较是否可以互换?
博士学位

@doctorate:听起来您正在按照与Par1结果相关的因素对小组进行分层,对吗?只要您在特定的A / B功能象限内使用排列,那么我就假定您的主题是可互换的。在使用依赖于可交换性的测试之前,将需要进一步处理您的第一个测试(涉及功能)。特别是,您需要量化治疗效果并纠正特征A和特征B的混淆效果-否则,组的大小会影响整体结果(辛普森悖论)

1
@doctorate:我意识到我的上述评论可能与您想要的有点类似:您的情况下的罐子是一对特征,即(A +,B +),(A-,B +),(A +,B -),(B-,A-)共4个“罐”。这有助于使其更加具体吗?

Tks,但是让我这样的非统计学家感到困惑的是,如何判断这个假设是否得到满足呢?经常有检验假设的检验,例如,对于正态性,有Shapiro-Wilk检验。但是我不知道哪种测试会检验可交换性?否则,这将是非常困难或模糊的定义,并且两个统计学家可能对此分组没有一致意见。正如您所提到的,在A / B象限内没有问题,但是在Drug /安慰剂中您表现出了一些担忧。那么对于这个假设是否有任何酸性测试?
博士学位

2
就可交换性而言,没有可交换性的“测试”。与独立性(这是可测试),exchangability更是一个模型假设你采取重复样品象你的人,你会发现,每个置换occurrs准确的时间相同的分数。您只有1个样本,因此您无法对其进行“测试”。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.