在生存分析中,为什么我们使用半参数模型(Cox比例风险)而不是完全参数模型?


24

我一直在研究Cox比例危害模型,大多数文本都掩盖了这个问题。

考克斯建议使用部分似然法拟合危险函数的系数,但为什么不仅仅使用最大似然法和线性模型拟合参量生存函数的系数呢?

在任何情况下,只要您检查了数据,就可以找到曲线下的面积。例如,如果您的估计值为380,标准差为80,并且样本的检查数量大于300,则在假设法向误差的情况下,可能性计算中该样本的概率为84%。


尽管我希望在这里有精算科学问题,但我不得不说这个问题可能会在统计站点Cross Validated中得到更好的答复。您可以请求主持人迁移它。
Graphth

好吧,没有意识到那是存在的。不确定如何请求迁移。请迁移?

@Graphth,我也没有意识到有一个...我没有在“所有站点”列表中找到它,您可以在这里链接到它吗?谢谢

Answers:


27

如果您知道数据遵循的参数分布,则使用最大似然法,这样的分布才有意义。Cox比例风险回归的真正优势在于,您仍然可以在不知道(或假设)分布的情况下拟合生存模型。您提供了一个使用正态分布的示例,但是大多数生存时间(以及使用Cox PH回归的其他类型的数据)都接近正态分布。有些可能遵循对数正态分布,Weibull分布或其他参数分布,并且如果您愿意进行此假设,则最大似然参数法非常有用。但是在许多现实情况下,我们不知道适当的分布是什么(甚至是足够接近的近似值)。使用审查和协变量,我们无法做一个简单的直方图并说“对我来说看起来像...的分布”。因此,拥有一种无需特定发行即可行之有效的技术非常有用。

为什么使用危险代替分布函数?考虑以下陈述:“ A组中的人在80岁时死亡的可能性是B组中的人的两倍”。现在这可能是正确的,因为B组中的人比A组中的人寿命更长,或者B组中的人的寿命较短,并且大多数人在80岁之前就已经去世,因此可能性很小。他们中的80岁去世,而A组中的足够多的人活到80岁,以致于相当多的人在该年龄死亡,而在该年龄死亡的可能性更高。因此,同样的说法可能意味着,在A组比在B组中好或坏。更有意义的是,在80岁以下的人们(每组)中,有多少比例会在81岁之前死亡。那就是危害(危害是分布函数/生存函数/等的函数)。该危害在半参数模型中更容易处理,然后可以为您提供有关分布的信息。


7
好答案。时间的独特之处在于它会朝一个方向传递,一旦我们度过了高风险期,我们就对现在有效的风险非常感兴趣。这就是危害函数告诉我们的。
Frank Harrell

2
值得补充的另一点是,在审查数据的情况下,检查分布假设可能非常困难。例如,假设只有20%的受试者观察到事件。试图确定分布的尾部是否遵循Weibull分布显然是不可能的!Cox-PH模型在一定程度上避开了这个问题(但是,如果您想推断出高度审查的时间范围,则必须非常警惕比例风险假设)
Cliff AB

16

“我们”不一定。生存分析工具的范围从完全非参数的模型(如Kaplan-Meier方法)到完全参数的模型,您可以在模型中指定潜在危害的分布。每个都有其优点和缺点。

半参数方法(例如Cox比例风险模型)使您无需指定潜在的风险函数就可以摆脱困境。这可能会有所帮助,因为我们并不总是了解潜在的危害功能,而且在许多情况下也并不在意。例如,许多流行病学研究都想知道“暴露X会减少直到事件Y的时间吗?” 他们所关心的是患有X病和没有X病的患者之间的差异。在那种情况下,潜在的危害并不重要,并且错误指定风险的风险要比不了解风险更大。

但是有时候这也不是真的。我已经完成了完全参数化模型的工作,因为潜在的危害引起了人们的关注。


1
“……错误指定它的风险要比不知道它的后果更严重。” 这非常有帮助,谢谢。

您能否举例说明何时可能引起潜在的危害?
Dan Chaltiel

1
@DanChaltiel任何打算用于数学模型或类似模型的估计都将是一个示例-潜在的危险函数特别令人关注。
Fomite
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.