在Harrell的《回归建模策略》(第二版)中,有一节(第20.1.7节)讨论了Cox模型,其中包括我们也要估计其对生存率有主要影响的协变量(年龄在以下示例中)与我们不想估计其主要影响的协变量(在以下示例中为性别)。
具体而言:假设在总体中,(未知,真实)危险遵循模型
其中,是未知的,真实的,不应被估计的基准风险函数和,是未知的,真正的参数来从数据中估算出来。
(这个例子几乎是从书中摘录的。)
现在,Harrell表示可以将以上情况重写为分层Cox模型模型1:
,其中'相互作用,术语'等于零为女性,年龄为男性。这是方便的,因为这意味着我们可以使用标准技术用于估计和。
现在问这个问题。假设向两个研究人员A和B提供了从上述人群中抽取的相同患者样本。研究员一个拟合模型1,获得估计β 1,β 2为真正的参数β 1,β 2连同置信区间。
研究者B拍摄拟合两个普通的(即unstratisfied)的Cox-模型的更简单方法:模型2A:
的女性患者的样品仅在模型2B:
对男性患者仅于样品中。由此获得的估计,的真实参数分别与置信区间一起。
题:
- 难道这些估计一定是相同的(在这个意义上,β 1 = γ 1,β 2 = γ 2 - γ 1)?(回想一下,两位研究人员都在看相同的数据。)
- 置信区间必定相同吗?
- 它任何意义说,研究者A具有在壳体上研究者乙心理上的优势在于,因为研究人员A是再更可能怀疑和开关以估计更简约模型?