Kaplan-Meier曲线似乎与Cox回归不同


9

在R中,我正在对癌症患者进行生存数据分析。

我已经在CrossValidated和其他地方阅读了有关生存分析的非常有用的文章,并认为我了解如何解释Cox回归结果。然而,一个结果仍然困扰着我...

我正在比较生存与性别。Kaplan-Meier曲线显然对女性患者有利(我检查了几次我添加的图例是正确的,最大存活时间为4856天的患者确实是女性): 在此处输入图片说明

而Cox回归正在返回:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

因此,男性患者的危险比(HR)为gendermale0.6903。我的解释方式(不考虑Kaplan-Meier曲线)是:由于HR <1,所以作为男性患者是保护性的。更准确地说,女性患者在任何特定时间死亡的可能性比男性高1 / 0.6903 = exp(-coef)= 1.449。

但这似乎不像Kaplan-Meier曲线所说的!我的解释怎么了?


3
从您的KM曲线来看,似乎Cox回归的PH假设不成立。
深北

我知道了。我以前没有研究过!从图形上来说,这意味着我的Kaplan-Meier曲线应该是平行的,这样我才能安全地使用Cox,对吗?在大约2200天之前,这似乎差不多可以。在交集之前稍微查看一下所有数据的Cox结果,可以吗?
francoiskroll

4
注意:曲线,其中是第组的估计生存函数,在比例风险下应平行。正如@IWS指出的那样,女性组在大约3000天后的置信区间将非常宽(是否只有两个使它超过该点?),因此PH假设可能不会太糟糕。日志-日志小号^一世Ť小号^一世Ť一世
Scortchi-恢复莫妮卡

@DeepNorth:我真的没有看到有力的证据证明有比例危险。是的,曲线在技术上是重叠的...但是那是极端的尾巴。
Cliff AB

为了补充其他答案和意见,比较男性和女性的中位生存期或五年生存期。与Cox PH分析一致,该数据对男性有明显的好处。
Itamar

Answers:


12

这是非比例危险或生存分析中“耗竭”影响的一个很好的例子。我会尽力解释。

首先,请仔细看一下您的Kaplan-Meier(KM)曲线:您可以看到在第一部分(直到大约3000天),在t时刻处于危险中的人口中仍然活着的男性比例大于女性的比例(即蓝线比红线“高”)。这意味着,对于所研究的事件(死亡),确实男性具有“保护作用”。因此,危险比应介于0和1之间(系数应为负)。

但是,在第3000天之后,红线更高!这确实暗示了相反的情况。仅根据该KM图,这将进一步表明存在非比例危害。在这种情况下,“非比例”表示自变量(性别)的影响在一段时间内不是恒定的。换句话说,随着时间的流逝,危险可以改变。如上所述,似乎是这种情况。常规比例风险Cox模型不适应此类影响。实际上,主要假设之一是危险是成比例的!现在,您实际上也可以对非比例风险建模,但这超出了此答案的范围。

还有另外一条评论:这种差异可能是由于真正的危险是非比例的KM曲线的尾部估计值存在很大差异的事实。请注意,此时,总共348名患者将下降到仍然处于危险之中的非常小的人群。如您所见,两个性别组都有经历事件的患者和受检查的患者(垂直线)。随着处于危险之中的人口减少,生存估计将变得不确定。如果在KM线周围绘制了95%的置信区间,则会看到置信区间的宽度增加。这对于评估危害也很重要。简而言之,由于在研究的最后阶段处于风险中的人群和事件数量较低,因此这一时期将对初始Cox模型中的估计值贡献较小。

最后,这可以解释为什么危害(假设随时间推移而恒定)更符合KM的第一部分,而不是最终终点。

编辑:请参阅@Scrotchi对原始问题的现场评论:如前所述,在研究的最后阶段,低数量的影响是不确定在这些时间点的危害估计。因此,您也不太确定是否明显违反比例风险假设不是由于偶然原因。正如@ scrotchi所说,PH的假设可能并不那么糟糕。


1
(-1)尾巴交叉在末端,而我们的数据很少。实际上,“非比例危险”的证据仅基于两个观察结果(即,当t> 2800时,女性队列中只剩下两个对象,除此之外,该组中最后一个事件发生在大约t = 2100)
Cliff AB

2
@CliffAB感谢您对Cliff AB的反馈。不过,我有点困惑,因为您的发言恰恰是我要说的。我承认:它可能会更短一些。-1虽然有点苛刻:'(
IWS

2
也许这对我来说有点卑鄙。我唯一要说的是,当我看到这一点时,并不一定看到非比例风险的一个很好的例子,而尾巴上的数据却很少。我看到第一句话已经过修改(我想除非我第一次没有错过?),所以现在肯定不需要(-1)了。
Cliff AB

1
糟糕,看来我是第一次错过了。抱歉!
Cliff AB

没问题,至少我们同意答案:D
IWS

5

您对输出的性质感到困惑。这些数据表明:如果您是男性,则您的寿命可能会长于女性;女性的生存能力比男性高。这反映在回归输出中,因为成为MALE的作用是使对数风险比为负,例如,男性的风险低于女性。在大多数事件时间(当曲线呈“阶梯状”时),雄性生存曲线大于雌性生存曲线,Cox模型结果与图表非常吻合。KM曲线与回归模型输出一样确认了这一点。“十字”是无关紧要的。

KM曲线的尾部表现不佳,尤其是当它们接近0%和/或逐渐变细时。Y轴是剩余的比例。在研究中存活下来的相对较少的人,以及当时死亡的很少的人,估计的可靠性在直观和图形上都非常糟糕。我注意到,例如,您的队列中的女性明显少于男性并且在2,800天后,队列中剩余的女性不足10名,这由生存曲线中的步伐和缺乏检查事件证明。

有趣的是,由于使用KM曲线进行的生存分析,对数秩检验和Cox模型使用了生存时间排序,因此实际的生存持续时间与实际情况无关。实际上,您寿命最长的雌性本可以再存活100年,并且对分析没有影响。这是因为基准危害功能(过去13年未观察到任何事件)将假定在接下来的87年中没有死亡风险,因为那时没有人死亡。

如果您希望强大的HR为此获得正确的95%CI和p值,请robust=TRUE在Cox-PH中指定以获得三明治标准误差。在这种情况下,HR是在所有故障时间比较男性和女性的时间平均HR。


需要说明的是:在KM图中,雄性的存活率最高可达约2700天。在那之后,女性拥有更好的生存能力。但是那尾巴并不精确,因为那里的数据很少。您可以看到KM曲线中的两个步骤使女性的存活率从35%降低到0%,因此很可能是两个人。使用置信带绘制KM曲线将很有帮助。然后,我猜您会在大约2000天之内看到明显的分离,然后在那之后会重叠。
Harvey Motulsky

2
@HarveyMotulsky正确,但是KM的尾部非常不可靠。如果OP提取了CI,则它们会强烈重叠,因此可以推断,我们可以说2700天后的存活率是模棱两可的。
AdamO

就是我的意思。数据清楚地表明,雄性(在这种情况下,无论情况如何)至少在头2000天以上的存活率更高。
Harvey Motulsky
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.