什么是马尔可夫链?


9

我目前正在阅读一些有关马尔可夫链集总的文章,但我看不到马尔可夫链与普通有向加权图之间的区别。

例如,在文章“ 马尔可夫链中的最佳状态空间集总”中,它们提供了CTMC(连续时间马尔可夫链)的以下定义:

我们通过转换率矩阵考虑状态空间为的有限CTMC, 其转换速率矩阵为 。(S,Q)S={x1,x2,,xn}Q:S×SR+

他们根本没有提到马尔可夫特性,实际上,如果边缘的权重代表概率,那么我相信马尔可夫特性微不足道,因为该概率仅取决于链的当前状态,而不取决于导致链的路径。对它。

关于集总性的关系属性的另一篇文章中马尔可夫链的定义类似:

马尔可夫链将表示为三元组 ,其中是的有限状态集,是表示从一种状态到另一种状态的概率的转移概率矩阵,而是代表系统在特定状态下启动的可能性的初始概率分布。M(S,P,π)SMPπ

同样,没有提及过去或未来或独立。

第三篇论文《简单O(m logn)时间马尔可夫链集总法》中,他们不仅从未声明边缘的权重是概率,而且甚至说:

在许多应用中,值是非负的。但是,我们不做这个假设,因为在某些应用中故意将选择为,这通常使其为负数。W(s,s)W(s,s)W(s,S{s})

而且,有人指出,集总应该是减少状态数量同时保持Markov属性的一种方法(通过将“等效”状态聚合为更大的状态)。但是,对我来说,这似乎只是在简单地对概率求和,甚至不保证从聚合状态到聚合状态的跃迁的概率在范围内。那么,集总实际上保留了什么?[0,1]

因此,我看到两种可能性:

  • 我不明白什么是马尔可夫链,或者
  • 在这些论文中使用术语马尔可夫链是伪造的

有人可以澄清情况吗?

看起来确实有不同的社区在使用该术语,它们的含义千差万别。从我认为的这3篇文章看来,马尔可夫特性显得微不足道或毫无用处,而在另一类论文中,它看起来却很基础。


互联网上有大量的教科书和资源,它们解释了(a)马尔可夫链是什么,以及(b)精确的数学定义是什么。我们希望您在询问之前进行大量的研究和自学。那么,您是否咨询过其中任何资源?您在那找到了什么?PS我猜想,文献中的论文会假设您知道马尔可夫链的定义,而这些句子并不一定要作为马尔可夫链的精确形式定义,而仅仅是建立它们在谈话时使用的符号大约一个。
DW

过去或将来或独立是其后的属性,iirc。不过,应该在重量上有一些限制;也许有些事情可能会保持隐性,例如,将丢失的输出权重分配给导致接收器状态的边(参见不同的DFA定义)。
拉斐尔

4
@DW是的,我做到了。我发现,教科书中的马尔可夫链概念似乎与此类论文中使用的概念无关。这就是为什么我要问这个。
巴库里2015年

4
同样,还有第三种可能性。我认为您犯的错误是将这些论文中的陈述解释为马尔可夫链的定义。我想那可能不是这些陈述的意图。我猜这些作者假设您已经熟悉了马尔可夫链的定义,并且只是在尝试建立一些符号(对于同一个概念可以使用多种符号)。因此,请从该角度重新审视一下,看看是否在论文中找到与之相矛盾的内容(如果发现有任何疑问,请将其添加到问题中)。
DW

4
@DW好像OP进行了不错的研究并合理地构造了他的问题。是的,我们可以使用谷歌学习。但是您是否注意到Google在SE网站中排名很高?这是因为我们将信息压缩为(通常)单个,定义明确的问题。我们社区的共同努力创造了非常丰富和有价值的内容,这些内容比那里的信息页面和页面有用得多,从而带来了更有效的学习。
2015年

Answers:


10

连续时间马尔可夫链可以被表示为具有恒定的非负的边权重的有向图。有节点的有向图的恒定边权重的等价表示为 ×矩阵。的马尔可夫性质(即未来的状态仅依赖于当前状态)是隐含在恒定边缘权重(或矩阵中的常数项)。 隐性手段暗含。数学家将其用作委婉语,意思是“您应该自己证明它”。N × NNN×N

但是第一篇论文定义了与连续时间马尔可夫链一致的符号,有时也称为马尔可夫过程,而第二篇论文定义了与离散时间马尔可夫链一致的符号。他们说

πP是表示从一种状态转换为另一种状态的概率的转换概率矩阵,是表示系统在某种状态下启动的可能性的初始概率分布。[重点添加]π

他们假设矩阵随时间是恒定的(因此暗示了马尔可夫性质)。术语概率中隐含的事实是,每个常数都在范围内,每一列中的项之和为,中的项之和为。P 1 π 1[0,1]P1π1

我看不懂第三篇论文,它是付费的。如果要求矩阵每一列中的项的总和为1,则它们是概率,它们在谈论离散时间马尔可夫链。如果每一列中的条目可以求和为任意数,则这些条目代表的是速率而不是概率,它们正在谈论连续时间马尔可夫链。

连续时间马尔可夫链与离散时间马尔可夫链不同。在连续时间马尔可夫链中,边缘权重不代表概率,而是过渡率。边缘权重必须为非负数,但可以任意大,并且边缘的权重可以总计为任何非负数。该总和不需要为。1

对于连续时间和离散时间马尔可夫链,恒定的边权重(或等效地,过渡矩阵中的恒定项)都隐含着马尔可夫属性。


8

马尔可夫链有两种形式:连续时间和离散时间。

连续时间马尔可夫链(CTMC)和离散时间马尔可夫链(DTMC)均表示为有向加权图。

对于DTMC而言,过渡通常需要一个单位的“时间”。结果,对于弧上的权重,别无选择-如果您处于“ i”,则将概率设为“ j”。

对于CTMC,任意两个状态之间的过渡时间必须由指数随机变量给定。这是CTMC和DTMC之间的主要区别:DTMC始终具有单位转换时间。CTMC具有随机的过渡时间。

对于CTMC,通常是根据从源到目的地的指数随机变量的比率将权重放到弧上。那就是-惯例是将汇率放在弧线上,而不是概率。

负利率

尽管我记得所有的CTMC都以正率表示,但CTMC分析中确实出现了负率。

假设我们处于状态A,如下所示连接到B,C和D。

A-> B( B A 的比率负)A-> C( C A 的比率负)D-> A( D A 的比率正)

这可能与您的论文所指的不完全相同。我提出来的是,如果有人使用适当的约定,负权重不一定是荒谬的。

马尔可夫物业

对于DTMC,您是正确的。markov属性很容易满足。对于CTMC,满足markov属性,因为过渡是由指数随机变量(“无内存”)给出的。如果转换不是由指数随机变量给出的(例如相反,它们是一致的),那么我们将讨论“半马尔可夫链”或“半马尔可夫过程”。


感谢您对无记忆指数的说明。这说得通。我仔细检查了第三篇文章,他们明确表示他们不假定权重为非负值,因为(状态到其自身的比率有一个特殊的定义,通常定义为是(即减去与所有其他状态的比率之),这几乎总是使其为负数。W s S { s } sW(s,s)W(s,S{s})s
巴库里

上一篇论文对我来说是相当神秘的,因为他们在大多数论文中都没有使用马尔可夫链术语。即使动机是马尔可夫链,他们也有可能解决更普遍的问题。也就是说,与使用Laplace运算符(或出于某种原因而取反)一致。W(s,s)=W(s,S{s})
Sasho Nikolov 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.