ML指数分布的估计值(带有检查数据)


9

在生存分析中,假设rv的生存时间呈指数分布。现在考虑我有i_1 rv的 “结果” 。这些结果中只有一部分实际上是“完全实现”的,即其余观察结果仍然是“有效的”。Xix1,,xnXi

如果我想对分布的速率参数进行ML估计,该如何以连贯/适当的方式利用未实现的观测值?我相信它们仍然包含有用的信息以供估算。λ

有人可以指导我阅读有关该主题的文献吗?我确定它存在。但是,我很难找到适合该主题的关键字/搜索字词。


3
因此,您说的是,从要进行测量的随机变量中,可以说观测值表示“最终的”寿命(因为相关的随机变量在测量时已“死”),而其余观察结果是在测量时“仍然存活”的随机变量的生存长度吗?()nn1<nn2<nn1+n2=n
Alecos Papadopoulos

1
这是一个截断的模型,观察结束时“活动”随机变量被截断。
西安

1
Tobit模型以获取截断的数据和相关来源(例如,此处)。
理查德·哈迪

2
您似乎已经审查过数据,例如生命,有些人死了,但有些人还活着,所以您只知道,例如对于某些已知的常数。xi>titi
kjetil b halvorsen

3
注意两种情况之间有时细微的差异。截断混淆检查的情况并不少见,反之亦然。
Alecos Papadopoulos

Answers:


17

您仍然可以直接使用似然来估计参数。设观测 ,其指数分布为且未知。密度函数为,累积分布函数和尾部函数。假设前观测值被完全观测,而对于我们仅知道对于某些已知的正常数,x1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj。像往常一样,对于被检查的观测,似然性是“观测数据的概率”,它由,因此完全似然函数为 对数似然函数变为 具有相同的形式的对数似然用于通常的,完全观察到的情况下,除了从第一项在地方。用表示观测值和审查时间的平均值,的最大似然估计值变为P(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλλ^=rnT,您可以自己将其与完全观察到的情况进行比较。
 EDIT   

要尝试在评论中回答问题:如果对所有观察进行了审查,也就是说,我们没有等待足够长的时间观察任何事件(死亡),我们该怎么办?在那种情况下,,因此对数似然变为 ,即,它在呈线性递减关系。因此,最大值必须为!但是,零不是速率参数的有效值,因为它不对应于任何指数分布。我们必须得出结论,在这种情况下,最大似然估计器不存在!也许可以尝试为构建某种置信区间r=0

l(λ)=nTλ
λλ=0λλ基于对数似然函数?为此,请看下面。

但是,无论如何,在那种情况下,从数据中得出的真正结论是,我们应该等待更多的时间,直到发生一些事件...

这是我们可以为构造一个(单侧)置信区间的方法,以防所有观测结果都受到审查。在这种情况下,似然函数为,其形式与我们获得全部成功的二项式实验的似然函数的形式相同,即(另请参见关于的二项式估计的置信区间0或1)。在那种情况下,我们想要形式为的单侧置信区间。然后我们通过求解获得的间隔。λeλnTpnp[p¯,1]λlogp=λT

我们通过求解 得到的置信区间, 这样。这最终给出了的置信区间: p

P(X=n)=pn0.95    (say)
nlogplog0.95λ
λlog0.95nT.

1
阅读问题和答案,我想:“如果所有观察结果都是第二种类型,而我们仅知道,而没有完全观察到观察结果,该怎么办?” 将这种情况也包括在您的答案中,作为扩展将非常有用。xj>tj
Alecos Papadopoulos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.