Questions tagged «multiple-comparisons»

当执行多个假设检验时,表示有人担心要达到预期的功效和大小。

3
弗里德曼测验后如何正确应用Nemenyi事后测验
我正在比较多种数据集上多种算法的性能。由于不能保证这些性能指标呈正态分布,因此我选择了基于Demšar(2006)的Friedman检验和Nemenyi事后检验。 然后,我发现另一篇论文,除了建议其他方法(例如Quade测试和随后的Shaffer post-hoc测试)之外,它们以不同的方式应用Nemenyi测试。 如何正确应用Nemenyi事后测试? 1.使用学生化范围统计信息吗? 在Demšar的论文中,它表示如果平均秩差大于的临界距离CD,则拒绝零假设(两种算法没有性能差异 CD=qαk(k+1)6N−−−−−−−√CD=qαk(k+1)6N CD = q_{\alpha}\sqrt{{k(k+1)}\over{6N}} “临界值qα基于学生化范围统计量除以 ”2–√.2.\sqrt{2}. 经过一番挖掘后,我发现可以为某些alpha查找“临界值”,例如在的表中α=0.05α=0.05\alpha = 0.05查找无限的自由度(在每个表的底部)。 2.还是使用正态分布? 就在我以为自己知道该怎么做的时候,我发现另一篇论文再次让我感到困惑,因为它们仅使用正态分布。Demšar在第12页指出了类似的事情: 使用这些方法比较第i和第j分类器的测试统计量为 z值用于从正态分布表中找到相应的概率,然后将其与适当的。这些测试在调整值以补偿多次比较的方式上有所不同。z=(Ri−Rj)k(k+1)6N−−−−−√z=(Ri−Rj)k(k+1)6N z = {{(R_i − R_j)}\over{\sqrt{{k(k +1)}\over{6N}}}} αα\alphaαα\alpha 在此段落中,他正在谈论将所有算法与控制算法进行比较,但是这句话“它们调整方式的不同……以补偿多次比较”表明,这也应适用于Nemenyi检验。 因此,对我而言,合乎逻辑的是,根据正态分布的检验统计量计算p值,然后除以来校正该值。zzzk(k−1)/2k(k−1)/2k(k-1)/2 但是,这会产生完全不同的等级差异,从而拒绝原假设。现在,我陷入了困境,不知道该采用哪种方法。我强烈倾向于使用正态分布的方法,因为它对我来说更简单,更合乎逻辑。我也不需要查找表中的值,也不必绑定到某些重要值。 再说一次,我从未使用过学生化的距离统计数据,而且我也不了解。

1
Holm-Bonferroni检验的置信区间?
我是多重比较问题的新手。我想知道如何为Holm-Bonferroni方法计算置信区间? 我知道,对于Bonferroni方法,我们可以将置信度级别从更改为。1−α1−α1-\alpha1−αm1−αm1-\frac{\alpha}{m} 此方法对Holm-Bonferroni也有效吗? Edit:Edit:\bf{Edit}:似乎HB方法没有提供更正conf的过程。间隔。但是您能否评论一下,我可以使用一种方法进行p值校正,而另一种方法进行间隔校正?

1
局部Moran的I统计量(LISA)的p值调整
我正在使用spdep软件包在R中进行一些探索性空间分析。 我遇到了一个选项,用于调整使用函数计算的空间关联性本地指标(LISA)的plocalmoran值。根据文档,它的目标是: ...用于多个测试的概率值调整。 在p.adjustSP我进一步阅读的文档中,可用选项包括: 调整方法包括Bonferroni校正(“ bonferroni””),其中p值乘以比较次数。Holm(1979)(“” holm“”),Hochberg(1988)('“” hochberg“'),Hommel(1988)('” hommel“')和Benjamini&Hochberg(1995)也进行了四次较不保守的校正。 ('“ fdr”')。还包括传递选项(“ none”)。 前四种方法旨在严格控制家庭错误率。似乎没有理由使用未经修改的Bonferroni校正,因为它受到Holm方法的支配,该方法在任意假设下也有效。 当假设检验是独立的或非负相关时,Hochberg和Hommel的方法是有效的(Sarkar,1998; Sarkar和Chang,1997)。Hommel的方法比Hochberg的方法更强大,但是差异通常很小,并且Hochberg p值的计算速度更快。 Benjamini,Hochberg和Yekutieli的“ BH”(又名“ fdr”)和“ BY”方法控制错误发现率,即错误发现的预期比例在被拒绝的假设中。误发现率的条件不如家庭式错误率严格,因此这些方法比其他方法更有效。 出现的几个问题: 简而言之-这项调整的目的是什么? 是否有必要使用此类更正? 如果是,如何从可用选项中进行选择?

2
多元回归和多重比较
说我适合p个解释变量的多元回归。t检验将允许我检查如果这些中的任意单个是显著()。我可以进行部分F检验,以检查其中的某些子集是否有意义()。H0:β一世= 0H0:β一世=0H_0: \beta_i = 0H0:β一世= βĴ= 。。。= βķ= 0H0:β一世=βĴ=。。。=βķ=0H_0: \beta_i=\beta_j=...=\beta_k=0 我经常看到的是,某人从5个t检验中获得了5个p值(假设他们有5个协变量),而仅保持p值<0.05。这似乎有点不正确,因为确实应该进行多重比较检查吗?说像和是有意义的但不是,和这样的东西真的很公平吗?β1个β1个\beta_1β2β2\beta_2β3β3\beta_3β4β4\beta_4β5β5\beta_5 在相关说明中,假设我对2个独立模型(不同结果)进行了2个回归。是否需要对两个结果之间的重要参数进行多重比较检查? 编辑: 为了与类似的问题区分开,对p值是否还有其他解释:“在对所有其他协变量进行调整时,B_i是(有效的)”?似乎这种解释并不能让我查看每个B_i并将那些小于0.5的B_i删除(这与另一篇文章类似)。 在我看来,一种确定B_i和Y是否存在关系的肯定方法是为每个协变量获取一个相关系数p值,然后执行multcomp(尽管这肯定会丢失信号)。 最后,假设我计算了B1 / Y1,B2 / Y1和B3 / Y1之间的相关性(因此是三个p值)。无关地,我还在T1 / Y2,T2 / Y2,T3 / Y2之间进行了关联。我假设正确的Bonferroni调整对于所有6个测试一起为6(而不是第一组为3,第二组为3-从而获得2个“半”调整后的p值)。

2
多重比较的层次模型-多重结果上下文
我刚刚(重新)阅读了格尔曼的《为什么我们(通常)不必担心多重比较》。特别是 “多重结果和其他挑战”部分提到在不同时间/条件下同一个人/单位有多个相关度量的情况下使用分层模型。它似乎具有许多理想的特性。 我了解这不一定是贝叶斯方法。有人可以告诉我如何使用rjags和/或lmer(常规JAGS和BUGS以及其他混合模型库,例如MCMCglmm)也可以正确地构建多变量多级模型,以便我可以进行比较和比较。对比结果?我想要模型的情况类型反映在下面的玩具数据中(多变量,重复测量): set.seed(69) id <- factor(rep(1:20, 2)) # subject identifier dv1 <- c(rnorm(20), rnorm(20, 0.8, 0.3)) # dependent variable 1 data for 2 conditions dv2 <- c(rnorm(20), rnorm(20, 0.3, 0.6)) dv3 <- c(rnorm(20), rnorm(20, -0.3, 0.8)) dv4 <- c(rnorm(20), rnorm(20, 0.2, 1 )) dv5 <- c(rnorm(20), rnorm(20, 0.5, 4 …

3
相关系数的阈值,以指示相关矩阵中相关的统计意义
我已经计算出包含455个数据点的数据集的相关矩阵,每个数据点包含14个特征。因此,相关矩阵的维数为14 x 14。 我想知道相关系数的值是否存在阈值,该阈值指出其中两个特征之间存在显着的相关性。 我的价值介于-0.2到0.85之间,我一直认为重要的是那些高于0.7的价值。 是否为阈值考虑了相关系数的一般值,或者仅仅是上下文取决于我正在研究的数据类型?

2
时间序列集比较
我要比较三组时间序列数据。他们在大约12天的3个不同时期服用。它们是在决赛周期间在大学图书馆中记录的平均,最大和最小人数。我必须做平均值,最大值和最小值,因为每小时的人头计数不是连续的(请参阅时间序列中的常规数据空白)。 现在数据集看起来像这样。每个晚上有一个数据点(平均,最大或最小),持续12个晚上。仅在所关注的12天之内,收集了3个学期的数据。因此,例如,2010年春季,2010年秋季和2011年5月每个都有12点。这是一个示例图表: 我已经覆盖了整个学期,因为我想看看每个学期的模式如何变化。但是,正如我在链接线程中所知,将两个学期并排拍打不是一个好主意,因为它们之间没有数据。 问题是:我可以使用哪种数学方法来比较每个学期的出勤模式? 我必须对时间序列进行任何特殊处理,还是可以简单地采用百分比差异?我的目标是说这几天的图书馆使用量正在上升或下降。我只是不确定应该使用哪种技术来显示它。


1
在同一个数据集上运行两个线性模型是否可以接受?
对于具有多个组(先验定义的自然组)的线性回归,是否可以在同一数据集上运行两个不同的模型来回答以下两个问题? 每个组是否具有非零的斜率和非零的截距,并且组回归中每个参数的参数是什么? 无论组成员身份如何,是否存在非零趋势和非零截距,并且跨组回归的参数有哪些? 在R中,第一个模型为lm(y ~ group + x:group - 1),因此估计的系数可以直接解释为每个组的截距和斜率lm(y ~ x + 1)。 备选方案将是lm(y ~ x + group + x:group + 1),这将导致复杂的系数汇总表,并且必须根据组中的斜率和截距来计算系数和截距,而斜率和截距必须来自某个参考。另外,您还必须重新排序组并再次运行模型,以获取最后一个组差异的p值(有时)。 这是否使用两个单独的模型以任何方式或这种标准惯例对推理产生了负面影响? 为了说明这一点,将x表示为药物剂量,将各组视为不同的种族。了解特定种族的医生的剂量反应关系可能很有趣,或者根本不知道药物对哪个种族起作用,但是有时了解整个(人类)人群的剂量反应关系也可能很有趣。不管竞选公共卫生官员。这只是一个例子,说明人们可能对组内和组间回归分别感兴趣。剂量反应关系是否应为线性并不重要。

2
如何测试?
假设我有三个独立的组,分别为均值。μ1, μ2, μ3μ1, μ2, μ3\mu_1,~ \mu_2,~\mu_3 如何使用每个组中的样本来测试是否?μ1&lt;μ2&lt;μ3μ1&lt;μ2&lt;μ3\mu_1 < \mu_2 <\mu_3n1, n2, n3n1, n2, n3n_1,~n_2,~n_3 我想知道一些一般的方法,而不是详细的计算。我不知道如何设置假设和。H0H0H_0H1H1H_1

1
发现高维,相关数据和主要特征/协变量;多重假设检验?
我有一个约有5,000个经常相关的特征/协变量和二进制响应的数据集。数据是给我的,我没有收集。我使用套索和梯度提升来构建模型。我使用迭代的嵌套交叉验证。我报告了Lasso在梯度增强树中最大(绝对)的40个系数和40个最重要的特征(40个并没有什么特别的;它似乎是一个合理的信息量)。我还报告了这些数量在CV的折叠和迭代中的变化。 我有点想“重要”功能,不对p值或因果关系或其他任何东西做任何陈述,而是考虑将此过程视为一种现象-尽管不完美,而且是某种随机性-而不是某种现象。 假设我正确完成了所有这些操作(例如,正确执行了交叉验证,针对套索进行了缩放),这种方法是否合理?是否存在多个假设检验,事后分析,错误发现等问题?还是其他问题? 目的 预测不良事件的可能性 首先,准确估计概率 更为次要的是,作为一项健全性检查,但也许还可以揭示一些可以进一步研究的新颖预测变量,请检查上述系数和重要性。 消费者 有兴趣预测此事件的研究人员以及最终不得不修复该事件的人员 我希望他们摆脱困境 如果他们希望使用自己的数据重复所述的建模过程,则使他们能够预测事件。 为意外的预测因素提供一些启示。例如,可能发现完全出乎预料的是最佳预测器。因此,其他地方的建模者可能会更认真地考虑所述预测变量。

1
全都在家里;但是我们也包括姻亲吗?
假设我有两个或更多因素的实验。构造了一个整体方差分析,然后我们进行了两组或更多组事后测试,即多次比较。我的问题是,应该使用多少个家庭,以及多少个家庭作为这些事后测试的多重性调整的基础。 一个例子是Tukey关于EDA的书中的翘曲断裂数据集。有两个因素:(wool两个级别)和tension(三个级别)。方差分析表为: Source Df Sum Sq Mean Sq F value Pr(&gt;F) wool 1 450.7 450.67 3.7653 0.0582130 tension 2 2034.3 1017.13 8.4980 0.0006926 wool:tension 2 1002.8 501.39 4.1891 0.0210442 Residuals 48 5745.1 119.69 显然,模型中需要交互。因此,我们决定比较每个因素的水平,同时保持另一个因素不变。结果如下,其中一些注释将在以后引用: *** Pairwise comparisons of tension for each wool *** *** All combined: Family T *** wool …

4
如果我有很多积极的,微不足道的结果,我是否可以测试“ 这些结果中至少是积极的”?
假设我分别对100个不同的人进行了相同的回归分析。我感兴趣的系数是正的(并且彼此之间有很大差异),但在所有100个结果中统计上都无关紧要(假设每个p值= 0.11)。 有没有一种方法可以将这些p值组合起来,以得出“这些结果中至少有80个是阳性”的结论,其意义远大于p = 0.11?我的在线搜索仅显示了我如何通过Fisher或类似测试怎么说“这些结果中至少有1项是肯定的”,但我无法对此结果进行概括。我想测试“ H0 =所有100种效果在0时都相同”对“ HA =至少80种效果是正值”。 我的目标不是说平均有一个正系数,也不是专门测量该系数。我的目标是有意义地证明,至少有80个人面对着一些积极的影响,而不论80个人,以及每个人感受到的影响程度如何。

2
Benjamini-Hochberg依赖性假设是否成立?
我有一个数据集,用于测试三个总体之间在大约50个不同变量方面的显着差异。一方面,我使用Kruskal-Wallis检验,另一方面,通过嵌套GLM模型拟合的似然比检验(具有和不具有总体作为自变量)进行此操作。 结果,一方面,我列出了Kruskal-Wallis,另一方面,我认为是LRT比较中的卡方p值。pppppp 我需要做某种形式的多重测试校正,因为有50多种不同的测试,Benjamini-Hochberg FDR似乎是最明智的选择。 但是,变量可能不是独立的,它们中的几个“氏族”是相关的。然后的问题是:我如何确定我的p值的基础统计信息集是否ppp满足Benjamini-Hochberg过程仍然要绑定到FDR所需的正相关性要求? 2001年的Benjamini-Hochberg-Yekutieli论文指出,PRDS条件适用于多元正态分布和学生分布。对于模型比较,我的似然比检验卡方值怎么样?对于Kruskal-Wallis检验,我的ppp如何? 我可以使用Benjamini-Hochberg-Yekutieli最坏情况的FDR校正,该校正在假设依赖项时不做任何假设,但我认为在这种情况下,它可能过于保守,并且会丢失一些相关信号。

1
分阶段控制错误发现率
我有一个尺寸为三维表。表格中的每个单元格都是假设检验。在第三维上对表进行切片会产生组假设检验,这些检验在各组之间独立但在组内相关。最初,我以为可以同时使用Benjamini-Hochberg过程控​​制所有假设检验的错误发现率。这是解决这个问题的合理方法吗?我的第二个想法是控制表格第三个维度中每个切片内的错误发现率,然后在此之后进行其他某种校正。有人有关于这种程序的更多信息吗?6 × 6 × 816×6×816\times6\times81818181

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.