Questions tagged «permutation-test»

基于与原假设相符的数据重新排列的统计检验。

2
重采样/模拟方法:蒙特卡洛,自举,千斤顶,交叉验证,随机化测试和置换测试
我试图理解不同重采样方法(蒙特卡罗模拟,参数自举,非参数自举,顶峰,交叉验证,随机化测试和置换测试)之间的区别,以及它们在我自己的环境中使用R的实现。 假设我遇到以下情况–我想对Y变量(Yvar)和X变量(Xvar)执行ANOVA 。Xvar是绝对的。我对以下事情感兴趣: (1)p值的意义–错误发现率 (2)效果Xvar等级 大小 Yvar <- c(8,9,10,13,12, 14,18,12,8,9, 1,3,2,3,4) Xvar <- c(rep("A", 5), rep("B", 5), rep("C", 5)) mydf <- data.frame (Yvar, Xvar) 您能帮我用明确的工作示例解释采样差异吗,这些重采样方法是如何工作的? 编辑: 这是我的尝试: Bootstrap 10个Bootstrap样本,样本数量已替换,意味着可以重复样本 boot.samples <- list() for(i in 1:10) { t.xvar <- Xvar[ sample(length(Xvar), length(Xvar), replace=TRUE) ] t.yvar <- Yvar[ sample(length(Yvar), length(Yvar), replace=TRUE) ] …

4
看,你会发现(相关性)
我有几百个测量值。现在,我正在考虑使用某种软件将每个度量与每个度量相关联。这意味着有成千上万的相关性。在这些数据中,即使数据是完全随机的(每个度量值仅包含约100个数据点),它们之间也应具有高度的相关性。 找到关联后,如何将有关如何寻找关联的信息纳入其中? 我的统计水平不高,请耐心等待。

6
R中使用哪种置换测试实现代替t检验(配对和非配对)?
我有使用t检验分析的实验数据。对因变量进行间隔缩放,并且数据不成对(即2组)或成对(即对象内)。例如(主题内): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 99.5, 99, 99, 99.5, 89.5, 99.5, 100, 99.5) y1 <- c(99, 99.5, 99.5, 0, 50, 100, 99.5, 99.5, 0, 99.5, 99.5, 90, 80, 0, 99, 0, 74.5, 0, 100, 49.5) 但是,数据并不正常,因此一位评论者要求我们使用t检验以外的其他方式。但是,很容易看出,数据不仅不呈正态分布,而且在不同条件之间分布也不相等: 因此,不能使用常规的非参数检验,Mann-Whitney-U检验(成对)和Wilcoxon检验(成对),因为它们要求条件之间的分布相等。因此,我认为最好进行一些重采样或置换测试。 现在,我正在寻找基于t检验的基于置换的R实现,或有关如何处理数据的任何其他建议。 我知道有一些R包可以帮我做到这一点(例如硬币,烫发,exactRankTest等),但我不知道该选哪个。因此,如果有一些使用这些测试的经验的人可以给我一个快速的开始,那将是ubercool。 更新:如果您可以提供一个如何报告此测试结果的示例,那将是理想的。

3
Bootstrap vs.排列假设检验
有几种流行的重采样技术,通常在实践中使用,例如自举,置换测试,折刀等。有许多文章和书籍讨论了这些技术,例如Philip I Good(2010)置换,参数化和自举测试假设 我的问题是,哪种重采样技术已经越来越流行并且更易于实施?自举或置换测试?

3
使用带有R的引导程序计算p值
我使用“ boot”包来计算近似的两面自举p值,但是结果与使用t.test的p值相差太远。我无法弄清楚我在R代码中做错了什么。有人可以给我一个提示吗 time = c(14,18,11,13,18,17,21,9,16,17,14,15, 12,12,14,13,6,18,14,16,10,7,15,10) group=c(rep(1:2, each=12)) sleep = data.frame(time, group) require(boot) diff = function(d1,i){ d = d1[i,] Mean= tapply(X=d$time, INDEX=d$group, mean) Diff = Mean[1]-Mean[2] Diff } set.seed(1234) b3 = boot(data = sleep, statistic = diff, R = 5000, strata=sleep$group) pvalue = mean(abs(b3$t) > abs(b3$t0)) pvalue 两面自举的p值(pvalue)= 0.4804,但t.test的两面p值为0.04342。两个p值的差约为11倍。怎么会这样

1
关于t检验死亡的报道是否被大大夸大了?
通过阅读CV历来经典,我遇到了一个想澄清的声明。这是该帖子,我的问题是关于结束语:“我必须注意,我刚刚讲授的所有知识都已过时;现在我们有了计算机,我们可以做得比t检验更好。正如弗兰克所说,您可能想在被教您进行t检验的任何地方使用Wilcoxon检验。” 不必担心是否合理地假设样本均值的分布是否足以进行t检验是正常的,这显然是一个巨大的优势。而且我发现计算机可以轻而易举地排列两个数据矢量之间的长长的差异列表...我记得很多年前是手动完成的,但是我离题了... 那么,t检验真的已经成为过去吗?置换测试呢?在通常需要编写几行代码的意义上,它们是否太特别?

2
排列检验的假设是什么?
人们经常说置换测试没有假设,但是这肯定是不正确的。例如,如果我的样本之间存在某种关联,我可以想象对标签进行置换将不是正确的选择。唯一想到我发现的问题就是维基百科的这句话:“置换检验背后的一个重要假设是,观察值在原假设下是可以互换的。” 我不明白。 排列检验的假设是什么?这些假设如何与不同的可能排列方案联系在一起?

1
使用H0下的引导程序来测试两种方法之间的差异:在组内还是在合并样本中进行替换
假设我有一个包含两个独立组的数据: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), length (g2.lengths))) lengths = data.frame( lengths …

3
高度偏斜数据的t检验
我有一个包含成千上万次医疗费用数据观察值的数据集。该数据向右偏斜,并且有很多零。对于两组人来说看起来像这样(在这种情况下,这两个年龄段每个> 3000 obs): Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0 0.0 4536.0 302.6 395300.0 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0 0.0 4964.0 423.8 721700.0 如果我对此数据执行Welch的t检验,我会得到一个结果: Welch Two Sample t-test data: x and y t = -0.4777, df = 3366.488, p-value = 0.6329 alternative …

2
在置换测试中P值等于0
我有两个数据集,我想知道它们是否存在显着差异(这来自“ 两组显着不同?请测试使用 ”)。 我决定使用置换测试,在R中执行以下操作: permutation.test <- function(coding, lncrna) { coding <- coding[,1] # dataset1 lncrna <- lncrna[,1] # dataset2 ### Under null hyphotesis, both datasets would be the same. So: d <- c(coding, lncrna) # Observed difference diff.observed = mean(coding) - mean(lncrna) number_of_permutations = 5000 diff.random = NULL for (i …

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
随机检验和置换检验之间的区别
在文献中,术语“随机化”和“置换”可互换使用。许多作者都说“置换(aka随机化)测试”,反之亦然。 充其量我相信差异是微妙的,这取决于他们对数据的假设以及可以得出的结论。我只需要检查我的理解是否正确,或者我是否缺少更深的区别。 排列检验假设数据是从基础总体分布(总体模型)中随机抽取的。这意味着从置换检验得出的结论通常适用于来自总体的其他数据[3]。 随机化检验(随机化模型)“使我们能够放弃典型心理学研究的令人难以置信的假设-从指定分布中随机抽样” [2]。但是,这意味着得出的结论仅适用于测试中使用的样品[3]。 当然,区别仅在于人口的定义。如果我们将人群定义为“所有患有疾病且适合治疗的患者”,则排列检验对该人群有效。但是,由于我们将人群限制在适合治疗的人群中,因此它实际上是一项随机检验。 参考文献: [1] Philip Good,置换检验:关于检验假设的重采样方法的实用指南。 [2] Eugene Edgington和Patric Onghena,随机检验。 [3] Michael Ernst,置换方法:精确推断的基础

1
在文献中是否知道这种重新采样时间序列的方法?它有名字吗?
我最近在寻找重新采样时间序列的方法, 大约保留长存储进程的自相关。 保留观测值的范围(例如,重新采样的整数时间序列仍然是整数的时间序列)。 如果需要,可能只影响某些比例尺。 我针对长度为的时间序列提出了以下排列方案:2N2N2^N 通过成对的连续观测值对时间序列进行分类(有这样的分类)。分别以概率翻转它们中的每一个(即,从索引到)。2N−12N−12^{N-1}1:22:11/21/21/2 通过连续的观察值对获得的时间序列进行分类(其中有这样的分类)。用概率反转它们中的每一个(即从索引到索引)独立性。2 N - 24442N−22N−22^{N-2}1:2:3:44:3:2:11/21/21/2 与尺寸的仓重复该步骤,,...,总是逆转与概率仓。16 2 Ñ - 1 1 / 28881616162N−12N−12^{N-1}1/21/21/2 这种设计纯粹是经验性的,我正在寻找已经针对这种排列发布的作品。我也乐于接受其他排列或重采样方案的建议。

1
置换检验的置信区间和P值不确定性
我正在学习随机测试。我想到两个问题: 是的,通过随机化测试(我认为与置换测试相同)来计算p值很容易而且很直观。但是,如何像普通参数测试一样生成95%的置信区间? 当我阅读华盛顿大学有关置换测试的文档时,第13页上有一句话说: 对于1000个排列....,p = 0.05附近的不确定度约为 。±1%±1%\pm 1\% 我不知道我们如何得到这种不确定性。

5
如何用非参数测试(例如排列测试)测试交互作用?
我有两个类别/名义变量。它们每个只能采用两个不同的值(因此,我总共有4种组合)。 每个值组合都带有一组数字值。因此,我有4组数字。为了更具体,让我们说我有male / female和young / old作为标称变量,而我有weight从属数字“输出”。 我知道从过渡male到female会改变平均体重,而这些变化在统计上是有意义的。因此,我可以计算一个gender因子。这同样适用于age变量。我知道,从过渡young到old不改变平均重量,我可以计算出相应的age系数。 现在,我真正想看看的是数据是否证明从年轻女性到老年男性的转变更多地是性别和年龄因素的结合。换句话说,我想知道数据是否证明存在“ 2D效果”,或者换句话说,年龄和性别效果不是独立的。例如,男性变老可能会使体重增加1.3倍,而女性则相应增加1.1倍。 当然,我可以计算两个提到的因素(男性的年龄因素和女性的年龄因素),它们是不同的。但是我想计算出这种差异的统计意义。这种差异有多真实。 如果可能的话,我想做一个非参数测试。是否可以通过混合四组,重新组合,重新拆分和计算某些东西来做我想做的事情。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.