赖曼在生存分析中对审查的解释


13

我已经阅读了什么是审查,以及如何在生存分析中考虑它,但是我想听听它的数学定义少而定义直观(图片很棒!)。谁能为我提供以下解释:1)审查和2)它如何影响像Kaplan-Meier曲线和Cox回归之类的事情?


我建议听有关生存分析的线性离题播客,并听听他们对左右审查的简化定义以及cox模型的动机。
Uri Goren

Answers:


16

通常将删节与截断进行比较。Gelman等人(2005,第235页)对这两个过程进行了很好的描述:

截断的数据与检查的数据不同,截断点之外没有观察值。通过审查, 截断点之后的观测会丢失,但会观察到它们的数量。

对于高于某个级别(右审查),低于某个水平(左审查)或两者的值,可能会进行审查或截断。

2.02.0

在此处输入图片说明

审查的直观示例是,您向受访者询问他们的年龄,但只记录某些年龄以下的值,并且超过该值的所有年龄(例如60岁)都记录为“ 60岁以上”。这将导致获得有关非删节值的精确信息,而没有有关删节值的信息。

并非如此典型,在波兰的matura考试成绩中观察到了真实的审查范例,这在互联网上引起了很多关注。该考试是在高中结束时进行的,学生必须通过考试才能申请高等教育。您可以从下面的图中猜出学生通过考试所需的最低分数是多少?不足为奇的是,如果您在略过检查范围的上方适当地选择了过量表示的分数,则可以很容易地“填充”正态分布中的“空白”。

在此处输入图片说明

进行生存分析时

当我们掌握了有关个体生存时间的信息时,就会进行审查,但我们并不确切知道生存时间

(Kleinbaum和Klein,2005年,第5页)。例如,您用某种药物治疗患者并观察他们直到研究结束,但是您不知道研究结束后他们会发生什么(是否有复发或副作用?),您唯一了解的是他们“生存” 至少到研究结束为止。

下面您可以找到使用Kaplan–Meier估计器建模的Weibull分布生成的数据示例。蓝色曲线标记了在整个数据集上估计的模型,在中间图中,您可以看到删减样本和根据删失数据估计的模型(红色曲线),在右侧您可以看到截断样本和对该样本估计的模型(红色曲线)。如您所见,数据丢失(截断)对估计值有重大影响,但是可以使用标准生存分析模型轻松管理检查。

在此处输入图片说明

这并不意味着您无法分析截断的样本,但是在这种情况下,您必须使用丢失数据的模型来试图“猜测”未知信息。


Kleinbaum,DG和Klein,M.(2005年)。生存分析:自学教材。施普林格。

Gelman,A.,Carlin,JB,Stern,HS和Rubin,DB(2005)。贝叶斯数据分析。查普曼和霍尔/ CRC。


您知道马图拉剧情的来历吗?我尝试使用Google搜索,并不断获取reddit链接,但该链接不包含任何引用。它仅指向imgur.com,没有任何归属。更新:找到了。cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/...第18页
阿米巴说恢复莫妮卡

1
@amoeba,如果您对更多详细信息感兴趣,请随时与我联系。不幸的是,我所知道的有关该主题的大多数材料都是波兰语的。图片是一回事,但我的一位朋友对此数据进行了更详细的分析(顺便说一句,可应要求提供)。
蒂姆

2

审查对于生存分析至关重要。

基本思想是信息是经过审查的,您看不到它。简而言之,如果您记录样本中每个人死亡之前的生命时间,则会获得生命的经过审查的分布。如果您想到时间在X轴上“向右”移动,则可以称为“右审查”。

还有其他类型:左审查和窗口审查。参见例如Sage发布的有关事件历史分析的Allison 1984年文本,以进行有启发性的介绍。

示例:如果要计算人口中的离婚率,则只想包括有离婚风险的个人(即,他们已婚)。如果人们因离婚(丧亲,废除婚姻)以外的其他原因终止了婚姻,那么您想对他们进行审查。他们不再有离婚的危险。您的Kaplan-Meier估算(和绘图)不应包括在经过审查的时间点之后的审查观测值,而应包括到该时间点为止的观测值。


图形还是绘图?
RustyStatistician
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.