在生存分析中使用对数秩与Mantel-Haenszel方法来计算危险比的优缺点是什么?


17

总结两条生存曲线比较的一种方法是计算危险比(HR)。有(至少)两种方法可以计算该值。

  • Logrank方法。作为Kaplan-Meier计算的一部分,计算每个组(和)中观察到的事件(通常为死亡)的数量,以及假设生存时间没有差异的零假设(和)的预期事件的数量。。则危险比为: OaObEaEb
    HR=(Oa/Ea)(Ob/Eb)
  • Mantel-Haenszel方法。首先计算V,它是每个时间点的超几何差异的总和。然后计算危险比为: 我从Machin,Cheung和Parmar,Survival Analysis的第3章获得了这两个方程。该书指出,这两种方法通常提供非常相似的方法,而书中的示例确实如此。
    HR=exp((OaEa)V)

有人给我举了一个例子,其中两种方法相差三倍。在此特定示例中,很显然对数秩估计是明智的,而Mantel-Haenszel估计值相差甚远。我的问题是,对于何时最佳选择危险比的对数估计,以及何时最佳选择Mantel-Haenszel估计,是否有人有任何一般性建议?与样本量有关吗?领带数量?样本数量比例?


这些估计与Cox回归给出的估计有何关系?那一定是估算人力资源的黄金标准。
Aniko

Cox模型包含协变量。Kaplan-Meier,Nelson-Aalen,Mantel-Haenszel方法将危害建模为仅随年龄变化的函数。
shabbychef 2010年

@shabbychef:对于Cox PH,请使用单个二进制协变量,即对于参考/比较组编码为0/1,则exp(beta)= HR。
ARS

当满足比例危险假设时,对数秩是比Cox PH更有效的测试。因此,对于单个2级协变量,对数秩或Mantel-Haenszel检验是更可取的。
Thylacoleo

看到下面的答案...
Thylacoleo

Answers:


11

我想我已经找到答案(针对我自己的问题)。如果比例危险的假设是正确的,则两种方法都可以得出相似的危险比估算值。我现在认为,在一个特定示例中发现的差异是由于这一假设令人怀疑。

如果比例危险的假设是正确的,则log(time)与log(-log(St))的关系图(其中St是时间t处的比例生存)应显示两条平行线。下面是根据问题数据集创建的图形。似乎远非线性。如果按比例风险的假设无效,那么风险比率的概念就没有意义,因此使用哪种方法来计算风险比率也无关紧要。

替代文字

我想知道是否可以使用危险等级的对数秩和Mantel-Haenszel估计之间的差异作为检验比例风险假设的方法?


7

如果我没记错的话,您引用的对数秩估计器也称为Pike估计器。我认为通常建议将HR <3用于此范围,因为它在该范围内的偏差较小。以下论文可能是您感兴趣的论文(请注意,该论文将其称为O / E):

[...] O / E方法是有偏见的,但是,在临床试验中所关注的危险率的比值范围内,就均方误差而言,它比CML或Mantel-Haenszel更为有效除了最大的试验以外的所有方法。Mantel-Haenszel方法的偏倚最小,其答案与使用CML获得的答案非常接近,可用于提供令人满意的近似置信区间。


简要浏览该论文后,我不确定他们考虑的估计是否与提问者方程式中的估计相同。我同意这个问题下的评论-也许在1981年,近似方法是有用的,但如今,没有明显的理由不使用Cox回归。
一站式

@onestop:嗯,想想O / E == LR的定义,上面忘记了日志吗?我同意您对Cox PH所说的话-这不是我要回答的问题,但您的建议在更广泛的背景下会更好。
ARS

伯恩斯坦等 等 说明导致两种方法不正确或不同的一些原因(小n,平差)。但是他们显示的所有差异都很小。因此,我认为该论文中没有任何内容可以解释引发该问题的三重差异。请参阅下面的答案。
哈维·莫图尔斯基

7

实际上还有其他几种方法,选择通常取决于您是对寻找早期差异,后期差异还是最感兴趣-还是对数秩检验和Mantel-Haenszel检验-对所有时间点赋予同等的权重。

对于眼前的问题。对数秩检验实际上是应用于生存数据的Mantel-Haenszel检验的一种形式。Mantel-Haenszel测试通常用于测试分层列联表中的独立性。

如果我们尝试将MH测试应用于生存数据,则可以假设每个故障时间的事件都是独立的。然后,我们根据故障时间进行分层。我们通过将每个故障时间作为分层来使用MH方法。毫不奇怪,它们经常给出相同的结果。

当同时发生多个事件时发生异常-完全在同一时间点有多人死亡。我不记得当时的治疗方式有何不同。我认为对数秩检验是对失败时间的可能顺序进行平均的。

因此,对数秩检验是针对生存数据的MH检验,可以处理纽带。我从未将MH测试用于生存数据。


3

我以为我偶然发现了一个网站和一个完全可以解决这个问题的参考资料:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 从“比较这两种方法”开始。

该站点引用了上面链接的Berstein论文ars:

http://www.jstor.org/stable/2530564?seq=1

该站点很好地总结了Berstein等人的结果,因此在此引用一下:

两者通常会给出相同(或几乎相同)的结果。但是,当多个对象同时死亡或危险比远非1.0时,结果可能会有所不同。

Bernsetin及其同事使用两种方法分析了模拟数据(1)。在所有模拟中,比例风险的假设都是正确的。两种方法给出的值非常相似。对数秩方法(它们称为O / E方法)报告的值比真实危险比更接近1.0,尤其是当危险比大或样本量大时。

有联系时,这两种方法的准确性都较低。对数秩方法倾向于报告的危险比甚至更接近1.0(因此,当危险比大于1.0时,报告的危险比太小;当危险比小于1.0时,报告的危险比太大)。相比之下,Mantel-Haenszel方法报告的危险比远高于1.0(因此,当危险比大于1.0时报告的危险比太大,而当危险比小于1.0时报告的危险比太小)。

他们没有使用模拟的数据来测试这两种方法,假设比例风险的假设不成立。我已经看到一个数据集,其中两个HR估计值相差很大(相差三倍),对于这些数据,按比例危险的假设是可疑的。似乎Mantel-Haenszel方法在较晚的时间点对危害的差异给予了更大的权重,而对数秩方法在各处都给予了相同的权重(但我没有对此进行详细探讨)。如果您发现这两种方法的HR值相差很大,请考虑比例危险的假设是否合理。如果该假设不合理,那么描述整个曲线的单一危险比的整个概念当然就没有意义。

该站点还引用了“两个HR估计值相差很大(相差三倍)”的数据集,并建议PH假设是一个关键考虑因素。

然后我想:“谁创作了这个网站?” 经过一番搜索,我发现它是Harvey Motulsky。因此,哈维(Harvey)在设法回答您自己的问题时已经设法向您推荐。您已经成为权威!

“问题数据集”是公开可用的数据集吗?


我两天前就找到了答案,并将其发布在这里作为新答案。然后,我还扩展并更新了您找到的graphpad.com上的网页。我刚刚再次编辑了该页面,以包含指向包含问题数据的Excel文件的链接(graphpad.com/faq/file/1226.xls)。在得到生成数据的人的允许之前,我无法做到这一点(他想匿名,并且数据被模糊地标记)。
哈维·莫图尔斯基
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.