Questions tagged «meta-analysis»

方法着眼于对比和合并不同研究的结果,以期提高准确性和外部有效性。

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

3
为什么在大型研究中发现较小的影响会表明发表偏见?
几篇方法论论文(例如Egger等,1997a,1997b)使用漏斗图(如下图)讨论了荟萃分析揭示的出版偏倚。 1997b论文继续说:“如果存在出版偏见,则预计在已发表的研究中,最大的研究将报告最小的影响。” 但是为什么呢?在我看来,所有这一切都可以证明我们已经知道:只有在样本量较大的情况下,才能检测到微小的影响。对尚未发表的研究一言不发。 另外,引用的工作还声称,在漏斗图中通过视觉评估的不对称性“表明存在选择性的不公开规模较小的试验,而获益较小。” 但是,再次,我不明白已发表研究的任何特征如何可能告诉我们有关未发表作品的任何信息(允许我们进行推论)! 参考 Egger,M.,Smith,GD和Phillips,AN(1997)。荟萃分析:原则和程序。BMJ,315(7121),1533-1537。 Egger,M.,Smith,GD,Schneider,M。,&Minder,C。(1997)。通过简单的图形化测试可以检测荟萃分析中的偏倚。BMJ,315(7109),629-634。


3
是什么导致发布的p值在p <.05处不连续?
在最近的一篇论文中,Masicampo和Lalande(ML)收集了许多不同研究中发表的大量p值。他们观察到p值直方图在标准临界值5%处出现了奇怪的跳跃。 Wasserman教授的博客上有一个关于ML现象的精彩讨论: http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ 在他的博客上,您将找到直方图: 由于5%水平是惯例而不是自然法则,是什么导致已发布p值的经验分布的这种行为? 选择偏差,正好在规范临界水平之上的p值的系统“调整”,还是什么?

2
统计取证:本福德及以后
有哪些广泛的方法可以检测第三方制作的科学作品中的欺诈,异常,伪造等情况?(最近马克·豪瑟(Marc Hauser)的事使我很想问这个问题。)通常对于选举和会计欺诈,会引用本福德定律的某些变体。我不确定如何将其应用于例如马克·豪瑟(Marc Hauser)案,因为本福德定律要求数字近似为对数统一。 举一个具体的例子,假设一篇论文引用了大量统计检验的p值。可以将其转换为对数均匀度,然后应用本福德定律吗?这种方法似乎会遇到各种各样的问题(例如,某些零假设可能合法地是错误的,统计代码可能会给出仅近似正确的p值,测试可能只会给出统一的p值渐近地在null下等)

2
结合来自多项研究的信息以估计正态分布数据的均值和方差-贝叶斯与荟萃分析方法
我已经审查了一组论文,每个论文都报告了在已知大小相应样本中的观测值的平均值和SD 。我想对我正在设计的一项新研究中同一度量的可能分布进行最大可能的猜测,以及该猜测的不确定性。我很高兴假设)。XXXññnX〜ñ(μ , σ2X〜ñ(μ,σ2X \sim N(\mu, \sigma^2 我的第一个想法是荟萃分析,但是通常使用的模型着重于点估计和相应的置信区间。但是,我想说一些关于充分分布,在这种情况下也将包括作出的猜测有关的方差,σ 2。 XXXσ2σ2\sigma^2 我一直在阅读有关根据先验知识估算给定分布的完整参数集的可能的Bayeisan方法。通常,这对我来说更有意义,但是我对贝叶斯分析的经验为零。这似乎是一个直截了当,相对简单的问题。 1)考虑到我的问题,哪种方法最有意义,为什么?荟萃分析还是贝叶斯方法? 2)如果您认为贝叶斯方法是最好的,您能指出我一种实现此方法的方法(最好在R中)吗? 相关问题 编辑: 我一直试图以我认为是“简单”的贝叶斯方式来解决这个问题。 正如我如上所述,我不只是有兴趣在估计平均,,而且方差,σ 2,在光的事先信息,即P (μ ,σ 2 | ÿ )μμ\muσ2σ2\sigma^2P(μ , σ2| ÿ)P(μ,σ2|ÿ)P(\mu, \sigma^2|Y) 同样,我对实践中的贝叶斯主义一无所知,但是不久之后,发现均值和方差未知的正态分布的后部通过共轭具有正态-反伽马分布的封闭形式解。 问题是重新表述为。P(μ , σ2| ÿ)= P(μ | σ2,Y)P(σ2| ÿ)P(μ,σ2|ÿ)=P(μ|σ2,ÿ)P(σ2|ÿ)P(\mu, \sigma^2|Y) = P(\mu|\sigma^2, Y)P(\sigma^2|Y) 估计与正常分布; P (σ 2 | Ý )与逆伽马分布。P(μ | σ2,Y)P(μ|σ2,ÿ)P(\mu|\sigma^2, …

5
贝叶斯统计量是否会使过分析变得过时?
我只是想知道,如果这样会使荟萃分析过时,那么从第一次研究到最后一次研究是否都可以应用贝叶斯统计方法。 例如,假设在不同时间点进行了20项研究。第一次研究的估计或分布是在没有先验信息的情况下进行的。第二项研究使用后验分布作为先验分布。现在将新的后验分布用作第三项研究的先验分布,依此类推。 最后,我们有一个估计,其中包含之前完成的所有估计或数据。进行荟萃分析是否有意义? 有趣的是,我想改变这种分析的顺序也会相应地改变最后的后验分布。

2
数据库的质量保证和质量控制(QA / QC)准则
背景 我正在监督从原始文献到数据库的数据输入。数据输入过程容易出错,尤其是因为用户必须解释实验设计,从图形和表格中提取数据并将结果转换为标准化单位。 数据通过Web界面输入到MySQL数据库中。到目前为止,已包含来自&gt; 20个变量,&gt; 100个物种和&gt; 500个引用的超过10,000个数据点。我不仅要检查变量数据的质量,还要检查查询表中包含的数据的质量,例如与每个数据点相关的种类,研究位置等。 数据输入正在进行中,因此QA / QC将需要间歇运行。数据尚未公开发布,但我们计划在未来几个月内发布。 目前,我的质量检查/质量控制涉及三个步骤: 第二个用户检查每个数据点。 直观检查直方图每个变量的异常值。 用户获得虚假结果后报告可疑数据。 问题 是否有可用于为该数据库开发健壮的QA / QC程序的指南? 第一步是最耗时的;有什么我可以做的以提高效率吗?

2
结果变量的多重插补
我有一个关于农业试验的数据集。我的反应变量是一个反应比率:log(治疗/对照)。我对调解差异的原因很感兴趣,因此我正在运行RE元回归(未加权,因为很明显效果大小与估计方差无关)。 每个研究报告谷物产量,生物量产量或两者。我无法从仅报告生物量产量的研究中得出谷物的产量,因为并非所有研究的植物都对谷物有用(例如,包括甘蔗)。但是每一种产生谷物的植物也都有生物量。 对于缺少的协变量,我一直在使用迭代回归插补(遵循安德鲁·盖尔曼的教科书章节)。它似乎给出了合理的结果,并且整个过程通常是直观的。基本上,我预测缺失值,并使用这些预测值预测缺失值,并遍历每个变量,直到每个变量近似收敛(分布)。 有什么原因使我无法使用相同的过程来估算缺失的结果数据?给定谷类响应比,作物类型和我拥有的其他协变量,我可能可以为生物量响应比形成一个相对有用的估算模型。然后,我将对系数和VCV求平均值,并按照标准做法添加MI校正。 但是,当推算结果本身时,这些系数将如何衡量?协变量的系数解释是否与标准MI有所不同?考虑一下,我无法说服自己这行不通,但我不确定。欢迎阅读材料的想法和建议。

4
结合两个置信区间/点估计
假设其中有两个来自相同总体的独立样本,并且对这两个样本使用了不同的方法来得出点估计和置信区间。在平凡的情况下,明智的人只会合并两个样本并使用一种方法进行分析,但是现在让我们假设由于样本之一的局限性(例如缺少数据)而不得不使用不同的方法。这两个单独的分析将为感兴趣的人口属性生成独立的,同样有效的估计。凭直觉,我认为应该有一种方法可以在点估计和置信区间方面适当地组合这两个估计,从而产生更好的估计程序。我的问题是最好的方法是什么?我可以想象根据每个样本中的信息/样本大小进行某种加权平均,但是置信区间又如何呢?

4
寻找良好的荟萃分析治疗方法
一位(非统计师)同事在他为医学期刊撰写的论文中遇到了荟萃分析,并且正在寻找良好的入门级治疗方法,以便他可以自学。有什么建议吗?最喜欢的?书籍,专着,非技术性调查文章都可以。 (是的,他熟悉Wikipedia条目以及Google搜索可轻松访问的其他内容,例如Jerry Dallal的精彩小文章。)

3
荟萃分析的利弊
我一直在考虑对进化的特定研究领域进行一些荟萃分析,但是在我进一步研究之前,我想知道一下。这个过程的正面和负面是什么?例如,不需要进行实际的实验是一个优势(时间和金钱),但是会存在出版偏见(发布更令人兴奋的结果),这将是不利的。 统计期刊上有哪些论文讨论了元分析的利弊?

2
从频繁结果中得出贝叶斯先验
如何将频繁出现的结果转换为贝叶斯先验结果? 考虑以下非常普通的场景:过去进行了一次实验,并测量了某些参数结果。该分析是采用常客方法进行的。结果中给出了置信区间。φϕϕ\phiϕϕ\phi 我现在正在进行一些新的实验,我想测量一些其他参数,例如和。我的实验与以前的研究不同---它不是使用相同的方法进行的。我想进行贝叶斯分析,因此需要将先验放在和。φ θ φθθ\thetaϕϕ\phiθθ\thetaϕϕ\phi 以前没有进行过测量,因此我在其上放了一个无信息的信息(例如其统一的信息)。 θθ\theta 如前所述,有一个先前的结果,以置信区间给出。要在我的当前分析中使用该结果,我需要将以前的常客性结果转换为内容丰富的先验信息以进行分析。 ϕϕ\phi 在这种组合方案中不可用的一个选项是重复先前的分析,以贝叶斯方式进行测量。 如果我可以做到这一点,那么将具有先前实验的后验,然后将其用作我的先验,那么就没有问题了。ϕϕ\phi ϕϕ\phi 我应该如何将常客身份CI转换为贝叶斯先验分布以进行分析?或者换句话说,我怎么可能对他们的翻译结果frequentest在成后,我会再在我的分析之前使用?φϕϕ\phiϕϕ\phi 欢迎讨论此类型问题的任何见解或参考。

1
在荟萃分析中指定效果大小的先验
我的问题上的担忧影响大小先验概率,在我的项目的措施是科恩的。通过阅读文献,似乎经常使用模糊的先验,例如在众所周知的八种流派的贝叶斯荟萃分析示例中。在这八所学校的示例中,我看到一个模糊的先验用于估计mu,例如 。dDDμθ〜正常(0 ,100 )μθ∼normal⁡(0,100)\mu_{\theta} \sim \operatorname{normal}(0, 100) 我的学科是心理学,效应的大小通常很小。因此,我正在考虑使用以下优先级:。我如此严格的先验的理由是,根据我对先验的理解,我将先验概率定为-1到1,在95%的先验概率中,有5%的先验概率大于- 1或1。μθ〜正常(0 ,.5 )μθ∼normal⁡(0,.5)\mu_{\theta} \sim \operatorname{normal}(0, .5)μθμθ\mu_{\theta} 由于影响如此之少,这种先验是否合理?

2
如果没有多级建模,如何在荟萃分析中处理研究内复制,而研究是复制的单位?
研究说明: 我已经观察到荟萃分析之间在研究内复制方面的一个常见错误。在陈述假设时,我不清楚错误是否使研究无效。但是,据我了解,这些假设违反了统计学的基本前提。 例如,一项研究测试了化学品对响应。ÿXXXÿYY 对数响应比率进行分析:处理(在的情况下)与控件(无)的比率: X Y 0 Xÿ+ XY+XY_{+X}XXXY0Y0Y_{0}XXX R=ln(Y+XY0)R=ln⁡(Y+XY0)R = \ln(\frac{Y_{+X}}{Y_{0}}) 荟萃分析中包含的某些研究包含多种处理方法,例如不同含量或化学形式。对于每种处理,都有一个不同的值,尽管始终使用相同的值。R R Y 0XXXRRRRRRY0Y0Y_0 方法说明: 在一项研究中对不同治疗(水平和形式)的反应被视为独立观察。XXX 问题: 这不是伪复制吗? 即使在方法中声明了违反独立性,这是否不合适? 在研究复制中进行处理的简便方法(例如,在简单的荟萃分析软件包的能力范围内)会是什么? 最初的想法: 总结每项研究的结果,例如通过平均反应 根据先验标准(例如最高剂量,首次测量)从每个研究中仅选择一种治疗? 还有其他解决方案吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.