在生存分析中,假设rv的生存时间呈指数分布。现在考虑我有i_1 rv的 “结果” 。这些结果中只有一部分实际上是“完全实现”的,即其余观察结果仍然是“有效的”。
如果我想对分布的速率参数进行ML估计,该如何以连贯/适当的方式利用未实现的观测值?我相信它们仍然包含有用的信息以供估算。
有人可以指导我阅读有关该主题的文献吗?我确定它存在。但是,我很难找到适合该主题的关键字/搜索字词。
在生存分析中,假设rv的生存时间呈指数分布。现在考虑我有i_1 rv的 “结果” 。这些结果中只有一部分实际上是“完全实现”的,即其余观察结果仍然是“有效的”。
如果我想对分布的速率参数进行ML估计,该如何以连贯/适当的方式利用未实现的观测值?我相信它们仍然包含有用的信息以供估算。
有人可以指导我阅读有关该主题的文献吗?我确定它存在。但是,我很难找到适合该主题的关键字/搜索字词。
Answers:
您仍然可以直接使用似然来估计参数。设观测 ,其指数分布为且未知。密度函数为,累积分布函数和尾部函数。假设前观测值被完全观测,而对于我们仅知道对于某些已知的正常数,。像往常一样,对于被检查的观测,似然性是“观测数据的概率”,它由,因此完全似然函数为 对数似然函数变为 具有相同的形式的对数似然用于通常的,完全观察到的情况下,除了从第一项在地方。用表示观测值和审查时间的平均值,的最大似然估计值变为
EDIT
要尝试在评论中回答问题:如果对所有观察进行了审查,也就是说,我们没有等待足够长的时间观察任何事件(死亡),我们该怎么办?在那种情况下,,因此对数似然变为 ,即,它在呈线性递减关系。因此,最大值必须为!但是,零不是速率参数的有效值,因为它不对应于任何指数分布。我们必须得出结论,在这种情况下,最大似然估计器不存在!也许可以尝试为构建某种置信区间
但是,无论如何,在那种情况下,从数据中得出的真正结论是,我们应该等待更多的时间,直到发生一些事件...
这是我们可以为构造一个(单侧)置信区间的方法,以防所有观测结果都受到审查。在这种情况下,似然函数为,其形式与我们获得全部成功的二项式实验的似然函数的形式相同,即(另请参见关于的二项式估计的置信区间0或1)。在那种情况下,我们想要形式为的单侧置信区间。然后我们通过求解获得的间隔。
我们通过求解 得到的置信区间, 这样。这最终给出了的置信区间: