如果我固定观察到的MRF节点的值,它会变成CRF吗?
如果我固定观察到的MRF节点的值,它会变成CRF吗?
Answers:
好吧,我自己找到了答案:
条件随机场(CRF)是Markov随机场(MRF)的特例。
1.5.4条件随机场
条件随机字段(CRF)是MRF的一种形式,它为变量x给定数据z定义了后验,就像上面的隐藏MRF一样。但是,与隐藏的MRF不同,没有明确分解为数据分布P(x | z)和先验P(x)[288]。这样就可以将x对z的复杂依赖关系直接写在后验分布中,而无需明确分解。(鉴于P(x | z),这样的因式分解总是存在,但是-实际上有很多分解式-因此没有建议CRF比隐藏的MRF更笼统,只是建议它可能更方便处理)
资料来源:布雷克,科利和罗瑟:马尔可夫用于视觉和图像处理的随机场。2011。
条件随机场或CRF(Lafferty等人,2001),有时是区分性随机场(Kumar和Hebert,2003),只是MRF的一种形式,其中所有集团势均以输入特征为条件:[...]
CRF相对于MRF的优势类似于判别式分类器相对于生成式分类器的优势(请参见第8.6节),即,我们不需要“浪费资源”对我们一直观察到的事物进行建模。[...]
CRF比MRF的缺点是它们需要标记的训练数据,并且训练较慢[...]
资料来源:凯文·P·墨菲:机器学习:概率论视角
回答我的问题:
如果我固定观察到的MRF节点的值,它会变成CRF吗?
是。固定值与对其进行条件化相同。但是,您应该注意,培训也有所不同。
MRF与贝叶斯网络:不太(但通常)而言,有两种类型的图形模型:无向图形模型和有向图形模型(另一种类型,例如Tanner图)。前者也被称为马尔可夫随机场/马尔可夫网络,而后者又被称为贝叶斯网络/贝叶斯网络。(有时两者的独立性假设都可以通过弦图表示)
马尔可夫暗示了它分解和随机场的方式 意味着无向模型所定义的那些之间的特定分布。
CRF MRF:当某些变量被观察到的,我们可以使用相同的无向图表示(作为无向图)和参数来编码一个条件分布其中是一组目标变量和是(不相交)一组观测变量。
唯一的区别在于,对于标准Markov网络,归一化项在X和Y上求和,而对于CRF,归一化项在Y上仅求和。
参考:
让我们将使用MRF的条件推理与使用CRF的建模进行对比,并沿途确定定义,然后解决原始问题。
关于图马尔可夫随机场(MRF)为
由于MRF表示服从马尔可夫约束的许多变量的联合分布,因此我们可以在给定某些变量的观测值的情况下计算条件概率分布。
例如,如果我有四个随机变量的联合分布:IsRaining,SprinklerOn,SidewalkWet和GrassWet,那么在星期一,我可能要推断IsRaining和SprinklerOn的联合概率分布,因为我已经观察到SidewalkWet = False和GrassWet =真正。考虑到我观察到SidewalkWet = True和GrassWet = True,在星期二,我可能想推断IsRaining和SprinklerOn的联合概率分布。
换句话说,我们可以使用相同的MRF模型在这两种不同情况下进行推断,但是我们不会说我们已经更改了模型。实际上,尽管我们在此处介绍的两种情况下都观察到了SidewalkWet和GrassWet,但是MRF本身本身并没有“观察到的变量”-所有变量在MRF的眼中都具有相同的状态,因此MRF也可以建模,例如,SidewalkWet和GrassWet的联合发行。
将变量的子集指定为“已观察”
仅在未观察到的给定观察变量上定义条件分布;它不会对观察到的变量的概率进行建模(如果用参数表示分布,这通常被认为是一种好处,因为参数不会浪费在解释将永远为人所知的事物的概率上)
除了可能节省模型参数,提高条件模型的表达能力和保持推理效率外,关于CRF公式的最后一个重要要点是,对于离散模型(以及很大一部分非离散模型),尽管存在为了表达CRF族,可以将对数似然表示为功能参数的凸函数,从而允许使用梯度下降进行全局优化。