贝叶斯网络中边缘的方向不相关吗?


10

今天,在一次演讲中,有人声称贝叶斯网络中边缘的方向并不重要。他们不必代表因果关系。

很明显,您无法在贝叶斯网络中切换任何单个边缘。例如,令V = { v 1v 2v 3 }E = { v 1v 2v 1v 3v 2v 3}。如果您要切换vG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}v 3v 1,则 G将不再是非循环的,因此不再是贝叶斯网络。那么,如何估计概率似乎主要是一个实际问题。这种情况似乎很难回答,因此我将跳过它。(v1,v3)(v3,v1)G

这使我提出以下问题,希望在这里获得解答:

  1. 有向无环图(DAG)是否有可能反转所有边并仍然具有DAG?
  2. 假设DAG 并给出了数据。现在我们构造逆DAG G inv。对于这两个DAG,我们将数据拟合到相应的贝叶斯网络。现在,我们要使用贝叶斯网络来预测缺少的属性的一组数据。两个DAG会有不同的结果吗?(如果您举了一个例子,请加分)GGv
  3. 与2相似,但更简单:假设DAG 并给出了数据。您可以通过反转任意一组边来创建新图G ',只要G '保持非循环即可。在预测方面,贝叶斯网络是否等效?GGG
  4. 如果我们有代表因果关系的边,我们会得到一些东西吗?

Answers:


6

TL; DR:有时您可以通过反向箭头来建立等效的贝叶斯网络,有时则不能。

简单地反转箭头的方向会生成另一个有向图,但是该图不一定是等效贝叶斯网络的图,因为由反向箭头图表示的依赖关系可能与原始图所表示的依赖关系不同。如果反向箭头图表示的依赖关系与原始图不同,则在某些情况下,可以通过添加更多箭头捕获反向箭头图中缺少的依赖关系来创建等效的贝叶斯网络。但是在某些情况下,没有完全等效的贝叶斯网络。如果您必须添加一些箭头以捕获依赖关系,

例如,与a -> b -> c代表相同的依存关系和独立性a <- b <- c,与相同a <- b -> c,但不相同a -> b <- c。最后一张图表示ac,如果b未观察到则是独立的,但在这种情况下a <- b -> cac是相关的。我们可以直接从添加的边缘ac以捕获,但随后ac时是独立的b,观察到未示。这意味着在计算后验概率时,我们至少不能利用一个分解因子。

关于依赖性/独立性,箭头及其反转等的所有这些内容都在贝叶斯网络的标准文本中进行了介绍。我可以根据需要挖掘一些参考。

贝叶斯网络不表达因果关系。在贝叶斯网络上做了很多工作的朱迪亚·珀尔(Judea Pearl)也致力于他所谓的因果网络(实际上是因果关系注解的贝叶斯网络)。


这回答了问题(2)和(3)。您对问题(1)和(4)也有想法吗?(是的,引用会很好)
Martin Thoma

(1)考虑相反的情况:如果反向箭头图有向循环,则跟随该循环的箭头向后跟随必须是原始图中的有向循环。(4)贝叶斯网络是概率模型,因此不代表因果关系。可能有一些箭头实际上指的是因果关系,但这在概率模型中会丢失。也许a原因b,但a -> ba <- b同样有效的概率模型。
罗伯特·多迪尔

一些入门参考。Koller&Friedman:“概率图形模型”。Cowell,Dawid,Lauritzen和Spiegelhalter:“概率网络和专家系统”。卡斯蒂略,古铁雷斯和哈迪:“专家系统和概率网络模型”。
罗伯特·多迪尔

只要保持v结构,您就可以反转任何箭头并获得等效的贝叶斯网络(不要反转另一个箭头也指向它所指向的节点的箭头)
borgr

1

这可能有点不满意,所以请随时不要接受此答案,并提前道歉。

在贝叶斯网络中,节点表示随机变量,边表示条件依赖性。当您以某种方式解释节点时,条件自然会以某种方式流动。在建模数据的上下文中,任意反转它们实际上没有任何意义。很多时候,箭头确实代表因果关系。


1
这远远没有实现。“自然”解释是强加在模型上的东西,不是模型本身的一部分。您可以反转依赖关系(根据需要添加其他边以保留网络表示的依赖关系集),它仍然是贝叶斯网络。仅检查网络本身并不能回答是否有意义。顺便提一句,朱迪亚·珀尔(Judea Pearl)是80年代和90年代贝叶斯网络背后的主要推动者之一,最近一直在研究因果关系的正式模型,该模型确实表达了因果关系。
罗伯特·多迪尔

您说:“仅通过检查网络本身,是否有意义就无法解决。” 我从来没有说过。我说:“当您以某种方式解释节点时,条件以某种方式流动……”这可能反映了我的偏见。您可以称呼我在贝叶斯网络上工作的东西,但是这个问题永远不会出现在我身上。例如,如果两个节点在不同的时间代表相同的变量,那么就不会出现条件流向哪个方向的问题。但是,我接受这样的可能性,在某些情况下,人们可能会以不太严格的方式使用这些Baye蚊帐。
泰勒

0

问题3

synergy.st-andrews.ac.uk/vannesmithlab声称这些图

G1 = o->o->o and
G2 = o<-o->o

属于同等等级。根据该消息来源,这些模型表示完全相同的联合概率分布。


那是不对的。对于G1,在没有任何已知值的情况下,第一个和最后一个依赖。对于G2,在没有任何已知值的情况下,第一个和最后一个不依赖。您是G2 = o <- o -> o不是要写?无论如何,我没有在您引用的网页上看到关于那些特定图形的声明;也许您可以更具体。
罗伯特·多迪尔
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.