我已经阅读了什么是审查,以及如何在生存分析中考虑它,但是我想听听它的数学定义少而定义直观(图片很棒!)。谁能为我提供以下解释:1)审查和2)它如何影响像Kaplan-Meier曲线和Cox回归之类的事情?
我已经阅读了什么是审查,以及如何在生存分析中考虑它,但是我想听听它的数学定义少而定义直观(图片很棒!)。谁能为我提供以下解释:1)审查和2)它如何影响像Kaplan-Meier曲线和Cox回归之类的事情?
Answers:
通常将删节与截断进行比较。Gelman等人(2005,第235页)对这两个过程进行了很好的描述:
截断的数据与检查的数据不同,截断点之外没有观察值。通过审查, 截断点之后的观测值会丢失,但会观察到它们的数量。
对于高于某个级别(右审查),低于某个水平(左审查)或两者的值,可能会进行审查或截断。
审查的直观示例是,您向受访者询问他们的年龄,但只记录某些年龄以下的值,并且超过该值的所有年龄(例如60岁)都记录为“ 60岁以上”。这将导致获得有关非删节值的精确信息,而没有有关删节值的信息。
并非如此典型,在波兰的matura考试成绩中观察到了真实的审查范例,这在互联网上引起了很多关注。该考试是在高中结束时进行的,学生必须通过考试才能申请高等教育。您可以从下面的图中猜出学生通过考试所需的最低分数是多少?不足为奇的是,如果您在略过检查范围的上方适当地选择了过量表示的分数,则可以很容易地“填充”正态分布中的“空白”。
进行生存分析时
当我们掌握了有关个体生存时间的信息时,就会进行审查,但我们并不确切知道生存时间
(Kleinbaum和Klein,2005年,第5页)。例如,您用某种药物治疗患者并观察他们直到研究结束,但是您不知道研究结束后他们会发生什么(是否有复发或副作用?),您唯一了解的是他们“生存” 至少到研究结束为止。
下面您可以找到使用Kaplan–Meier估计器建模的Weibull分布生成的数据示例。蓝色曲线标记了在整个数据集上估计的模型,在中间图中,您可以看到删减样本和根据删失数据估计的模型(红色曲线),在右侧您可以看到截断样本和对该样本估计的模型(红色曲线)。如您所见,数据丢失(截断)对估计值有重大影响,但是可以使用标准生存分析模型轻松管理检查。
这并不意味着您无法分析截断的样本,但是在这种情况下,您必须使用丢失数据的模型来试图“猜测”未知信息。
Kleinbaum,DG和Klein,M.(2005年)。生存分析:自学教材。施普林格。
Gelman,A.,Carlin,JB,Stern,HS和Rubin,DB(2005)。贝叶斯数据分析。查普曼和霍尔/ CRC。
审查对于生存分析至关重要。
基本思想是信息是经过审查的,您看不到它。简而言之,如果您记录样本中每个人死亡之前的生命时间,则会获得生命的经过审查的分布。如果您想到时间在X轴上“向右”移动,则可以称为“右审查”。
还有其他类型:左审查和窗口审查。参见例如Sage发布的有关事件历史分析的Allison 1984年文本,以进行有启发性的介绍。
示例:如果要计算人口中的离婚率,则只想包括有离婚风险的个人(即,他们已婚)。如果人们因离婚(丧亲,废除婚姻)以外的其他原因终止了婚姻,那么您想对他们进行审查。他们不再有离婚的危险。您的Kaplan-Meier估算(和绘图)不应包括在经过审查的时间点之后的审查观测值,而应包括到该时间点为止的观测值。