如何解释考克斯风险模型的生存曲线?


9

您如何从考克斯比例风险模型解释生存曲线?

在这个玩具示例中,假设我们对数据age变量有一个cox比例风险模型kidney,并生成了生存曲线。

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

在此处输入图片说明

例如,在时间,哪个说法是正确的?还是两者都不对?200

  • 陈述1:我们将剩下20%的主题(例如,如果我们有人,那么到200天时,我们应该剩下200个左右), 1000200200

  • 陈述2:对于一个给定的人,他/她有200 20%机会在200天生存200


我的尝试:我不认为这两个陈述是相同的(如果我错了,请纠正我),因为我们没有iid假设(所有人的生存时间不是独立地来自一个分布)。在这里我的问题类似于逻辑回归,每个人的危险率取决于该人的。βTx


请注意,您的模型假设事件时间之间具有独立性。
ocram

生存分析可以有独立性的假设
阿克萨卡(Aksakal)

因此似乎问题确实在R编码上,而不是纯统计上。您需要了解示例中使用的特定功能的语法和功能。如果是这种情况,那么这不是某种意义上的话题吗?否则,您需要向不使用R的人解释发生了什么
Aksakal

Answers:


5

由于危害取决于协变量,因此生存功能也是如此。该模型假定具有协变量向量的个体的危险函数为 因此,此人的累积危害为 我们可以将定义为基线累积危害。具有协变量向量的个体的生存函数依次为 ,其中我们将定义为基线生存函数。 x

h(t;x)=h0(t)eβx.
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
H0(t)=0th0(u)dux
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
S0(t)=eH0(t)

给定回归系数的估计值和和基线生存函数,则具有协变量向量的个体的生存函数的估算值由。β^S^0(t)xS^(t;x)=S^0(t)eβ^x

在R中进行计算,您可以在newdata参数中指定协变量的值。例如,如果您想要R中年龄为70岁的个体的生存函数,请执行

plot(survfit(fit, newdata=data.frame(age=70)))

如果您这样做,则忽略该newdata参数,则其默认值等于样本中协变量的平均值(请参阅参考资料?survfit.coxph)。因此,您的图形中显示的是的估计值。 S0(t)eβx¯


我同意你的看法。这是一个写得很好的答案。对于错误,我向OP表示歉意,并且感谢OP纠正它的方式。
Michael R. Chernick

@ hxd1101在survfit.coxph更仔细地阅读了帮助页面之后,我已更正了我的答案中的错误,请参阅更新。
Jarle Tufto

2

我们将剩下20%的主题(例如,如果我们有1000人,那么到200天时,我们应该剩下200个)?或对于给定的人,它有20%的机会在200天生存?

在您的示例中,Kaplan-Meier曲线以其最纯粹的形式没有做出任何上述陈述。

第一个语句做了一个前瞻性的投影会有。基本生存曲线仅描述过去,您的样本。是的,您的样本中有20%会在第200天生存下来。接下来的200天内有20%会生存吗?不必要。

为了做出该陈述,您必须添加更多的假设,构建模型等。该模型甚至不必像逻辑回归那样具有统计意义。例如,它可以在流行病学等领域使用PDE。

您的第二个陈述可能基于某种同质性假设:所有人都是相同的。


我认为陈述2是不正确的,因为每个人都有不同的而带来危险。我们怎么能假设所有人都一样?xβTx
海涛杜

@ hxd1011,取决于您的型号。如果您要对汽车零件建模,那么您可以很好地假设它们是相同的。另一方面,它们的故障可能与批号相关联,那么它们就不一样了
。– Aksakal

我将问题编辑为更具体地针对cox模型,您对Kaplan_Meier曲线的答案仍然适用吗?
海涛杜

2

感谢Jarle Tufto的回答。我认为我应该能够自己回答:这两种说法都是错误的。生成的曲线是而不是。S t S0(t)S(t)

仅当时,基线生存函数等于。因此,该曲线并未描述全部人口或任何个人。S t x = 0S0(t)S(t)x=0


0

您的第一个选择是正确的。一般地,表示初始的病人中有20%存活直到一天,而没有考虑到终检。根据审查的数据,当天仍有20%的人还活着是不正确的,因为有些人早些失传了,而且他们的状态未知。一种更好的说法是,估计当天仍然存活的患者比例为20%S(t)=0.2t

第二种选择(给定生存时间直到,有机会再生存一天)是,其中表示危险函数。1 h t h t t1h(t)h(t)

关于假设:我认为,在Cox回归设置中,通常的系数检验是否假设独立性,取决于观察到的协变量?甚至Kaplan-Meier估计似乎都要求生存时间和审查之间必须独立(参考)。但是我可能错了,因此欢迎进行更正。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.