我们有一个随机过程,该过程在设定的时间段内可能不会发生多次。我们有一个来自此过程的预先存在模型的数据馈送,该数据馈送提供了在期间内发生许多事件的概率。这个现有模型很旧,我们需要对Feed数据进行实时检查,以获取估计错误。产生数据馈送的旧模型(提供了在剩余时间发生事件的概率)近似为Poisson Distributed。T0≤t<Tnt
因此,为了检查异常/错误,我们让为剩余时间,为在剩余时间发生的事件总数。旧模型隐含了估计。因此,在我们的假设我们有:
为了从旧模型的输出(观测值y_ {t})中得出事件发生率\ lambda_t,我们使用状态空间方法,并将状态关系建模为:
y_t = \ lambda_t + \ varepsilon_t \ quad(\ varepsilon_t \ sim N( 0,H_t))\ ,.
tXttP(Xt≤c)Xt∼Poisson(λt)
P(Xt≤c)=e−λ∑k=0cλktk!.
λtytyt=λt+εt(εt∼N(0,Ht)).
我们使用状态空间[恒定速度衰减]模型对
\ lambda_t的演化使用旧模型进行
λt过滤,以获取过滤后的状态
E(λt|Yt)并从如果
E(λt|Yt)<yt。
这种方法在处理整个时间段T内估计事件计数中的错误时效果非常好T,但是如果我们想在另一个时间段0≤t<σ其中σ<23T。为了解决这个问题,我们决定现在要切换为使用负二项式分布,因此我们现在假设Xt∼NB(r,p)并具有:
P(Xt≤c)=pr∑k=0c(1−p)k(k+r−1r−1),
其中参数
λ现在被
r和
p代替
p。这应该很容易实现,但是我在解释时遇到了一些困难,因此我有一些问题希望您帮助:
1.我们能否仅在负二项分布中设置p=λ?如果没有,为什么不呢?
2.假设我们可以设置p=f(λ),其中f是某个函数,我们如何正确设置r(我们是否需要使用过去的数据集来拟合r)?
3. r是否r取决于我们期望在给定过程中发生的事件数量?
提取r(和p)的估计值的附录:
我知道,如果我们实际上解决了这个问题,并且对每个过程进行了事件计数,则可以采用和的最大似然估计量。当然,最大似然估计仅适用于样本方差大于样本均值的样本,但是如果是这种情况,我们可以为独立的均匀分布的观测值为:
从中我们可以写出对数似然函数为:
p N k 1,k 2,… ,k N L (r ,p )= N ∏ i = 1 P(k i ; r ,p ),l (r ,p )= N ∑ i = 1 ln (Γ (k i + r ))- N ∑ irpNk1,k2,…,kN
L(r,p)=∏i=1NP(ki;r,p),
l(r,p)=∑i=1Nln(Γ(ki+r))−∑i=1Nln(ki!)−Nln(Γ(r))+∑i=1Nkiln(p)+Nrln(1−p).
为了找到最大值,我们对和取偏导数并将它们设为零:
设置并设置我们发现:
p ∂ ř升([R ,p )rp∂ř升([R ,p)=∂p升([R ,p)=0p= Ñ Σ我= 1 ķ 我∂rl(r,p)∂pl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(1−p),=∑i=1Nki1p−Nr11−p.
∂rl(r,p)=∂pl(r,p)=0p=∑i=1Nki(Nr+∑Ni=1ki),∂rl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(rr+∑Ni=1kiN)=0.
使用牛顿甚至EM不能以闭合形式求解r的方程。但是,在这种情况下并非如此。尽管我们
可以使用过去的数据来获得静态的和但这对于我们的过程实际上并没有任何用处,但我们需要及时调整这些参数,就像使用Poisson所做的那样。
rp