我的答案摘要。我喜欢马尔可夫链建模,但是错过了“时间”方面。另一方面,专注于时间方面(例如平均时间)会错过“过渡”方面。我将进入以下一般建模(在适当的假设下,这可能会导致[markov过程] [1])。这个问题(当然是软件可靠性的经典问题?)背后还有很多“审查”统计数据。对于给定的投票状态,我的答案的最后一个等式给出了投票强度的最大似然估计值(向上为“ +”,向下为陶氏,为“-”)。从等式中我们可以看到,它只是您仅估计过渡概率的情况和仅衡量在给定状态下花费的时间的情况的中间结果。希望能有所帮助。−1
通用建模(重述问题和假设)。
令和是分别模拟投票日期和相关投票符号的随机变量(+1代表赞成,-1代表反对)。投票过程很简单(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
其中
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
这里重要的数量是 -jump
,其中可以是或而 则是一个很好的过滤条件,在一般情况下,如果没有其他知识,它将是:
。ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
但按照您的问题,我想您隐含地假设
这意味着对于存在确定性序列中的。
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
在这种形式主义中,您的问题可以重申为:“可能性”(或至少差异大于给定阈值)。μ+−1−μ+0>0
在此假设下,很容易证明是上的[齐次马尔可夫过程] [3],且生成器为YtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
回答问题(通过为统计问题提出最大似然估计)
,通过重新制定可以通过估计并建立其值的测试来解决问题。让我们修复并忘记索引,而不会失去一般性。(和)的估计可以在观察到(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp)其中是在状态花费的周期中的的长度(即连续时间),如果问题被赞成,为如果问题被反对为如果它是最后的观察状态,则为。TjjthpiYt=iηj+1−10
如果您忘记了最后一个观察状态的情况,则及的对是来自依赖于和的分布的iid :它的分布为(其中Exp是指数分布的随机,是+或-1,具体取决于谁实现了最大值)。然后,您可以使用以下简单引理(证明很简单):μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
引理如果和则和。 X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
这意味着的密度由下式给出:
,其中对于是指数随机变量的密度函数参数为。从这个表达式中,很容易得出和的最大似然估计量:f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
其中和。
p−=|i:δi=−1|p+=|i:δi=+1|
有关更高级方法的评论
如果要考虑当是最后一个观察到的状态时的情况(肯定比较聪明,因为当您经过 ,它通常是您的最后得分...),则必须修改一点推理。相应的审查是相对经典的...i−1
可能的其他方法可能包括以下可能性:
- 强度随时间降低
- 强度随着自上次投票以来所花费的时间而减少(我更喜欢这一点。在这种情况下,存在经典的方法来模拟密度如何降低...
- 您可能想假设是的平滑函数μ+ii
- ....您可以提出其他想法!