何时在其他机器学习方法上使用贝叶斯网络?


12

我希望这个问题可能没有确切的答案。但是我过去使用过许多机器学习算法,并且正在尝试了解贝叶斯网络。我想了解在什么情况下,或者您选择在哪种类型的问题上使用贝叶斯网络而不是其他方法?


3
对我来说,贝叶斯网络是一种定义模型中条件独立性的方法。定义好之后,我想您可以使用各种学习工具来估计模型参数。因此,我看到了参数学习与模型之间的清晰区分。但是,我不是专家,所以有人可以提供更好的答案。

Answers:


7

贝叶斯网络(BN's)是生成模型。假设你有一组输入,和输出。BN允许您学习联合分布,而不是像逻辑回归或支持向量机(Support Vector Machine)那样对条件分布建模。XYP(X,Y)P(Y|X)

学习数据的联合概率分布(生成模型)比学习条件概率(区分模型)更加困难。但是,前者提供了更通用的模型,您可以在其中运行诸如或等查询。使用判别模型时,您的唯一目的是学习。P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

国阵利用DAG规定联合分布。因此,它们是图形模型。

优点:

  1. 当您有很多丢失的数据时,例如在医学中,BN可以非常有效,因为对联合分布进行建模(即您对数据生成方式的断言)可以减少您对完整观察的数据集的依赖。

  2. 当您想要以一种视觉上透明的方式为域建模并且还旨在捕获关系时,BN可以非常强大。请注意,国阵的因果关系假设值得商debate。causeeffect

  3. 学习联合分布是一项艰巨的任务,尽管要为连续变量建模(通过条件概率表(即CPT)的计算),要比对连续变量进行建模要容易得多。因此,BN实际上在离散变量中更为常见。

  4. BN不仅允许观察推断(如所有机器学习模型所允许的),而且还允许因果干预。这是国行的一个通常被忽视和未被重视的优势,并且与反事实推理有关。


1
在优势1中,您说BN对具有很多缺失值的数据建模很有效,这些缺失值不会影响对数据独立性的正确识别吗?
侯赛因

1
是的,在拟合模型时,您仍然需要用一些假设来估算,但是一旦有了例如,则取决于DAG的因式分解(封装了独立性假设),如果已经可用,则可能不需要,反之亦然。P(Y,X1,X2)X1X2
朱巴卜

1

以我的经验,当存在高维分类数据时,贝叶斯网络可以很好地工作。他们提供了可解释的模型,有时(模型)有助于理解不同变量如何相互作用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.