生存分析:连续时间与离散时间


20

我对如何决定在生存分析中将时间视为连续时间还是离散时间感到困惑。具体来说,我想使用生存分析来确定对男孩和女孩(5岁以下)的生存影响最大的儿童和家庭变量。我有一个儿童年龄(以月为单位)的数据集,以及该儿童是否还活着,死亡年龄(以月为单位)以及其他儿童和家庭水平变量的指标。

由于时间是以月为单位记录的,并且所有儿童都在5岁以下,因此生存时间很多(通常每半年间隔:0mos,6mos,12mos等)。根据我对生存分析的了解,有很多捆绑的生存时间,使我认为我应该将时间视为离散的。但是,我还阅读了其他几项研究,例如生存时间以人年为单位(因此肯定存在生存时间),并且使用了诸如Cox比例风险之类的连续时间方法。

我应该使用什么标准来决定将时间视为连续时间还是离散时间?对于我的数据和问题,使用某种连续时间模型(Cox,Weibull等)对我来说很直观,但是我的数据的离散性质和有限的生存时间似乎暗示了其他问题。

Answers:


10

生存模型的选择应以潜在现象为指导。在这种情况下,即使数据是以某种离散的方式收集的,它也似乎是连续的。一个5个月的决议期就可以了。但是,在6个月和12个月时,大量的联系使您真的具有1个月的精确度(这是预期的在0处的联系-这是一个实际发生相对大量死亡的特殊值),这使人感到奇怪。我不太确定您能对此做些什么,因为这很可能反映事后的舍入而不是间隔检查。


2
根据一般经验,如果离散数据可以分为十个或更多部分,即使它确实是离散的,也可以将其视为连续的(六个月每月一次采样与六个月每周一次采样非常不同)或每月一次(两年一次)。下面的文章还给出了一些额外的见解处理离散数据连续:theanalysisfactor.com/count-data-considered-continuous
Tavrock

4

我怀疑如果使用连续时间模型,您将要使用间隔检查,这反映出您不知道确切的故障时间,而只是知道发生故障的时间间隔这一事实。如果您使用最大似然拟合对参数回归模型进行间隔审查,则存活时间不是IIRC的问题。


4

在大多数分析中,生存时间是很有限的,但是在特定事件中,巨大而清晰的联系很麻烦。我会对研究本身,如何收集数据等进行漫长而艰苦的思考。

因为,除了某些方法上需要使用一种或另一种时间类型外,如何对生存进行建模应取决于基础过程是世界上离散的还是连续的。


1

如果您的某些变量的协变量会随时间而变化(例如,在您的孩子一生中家庭收入可能会发生变化),生存模型(参数模型和cox模型)要求您将数据切成由变化的协变量。

我发现德语Rodriguez的这份pdf讲义很有帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.