贝叶斯网络在任何方面都胜过神经网络吗?


48

在计算机视觉任务中,神经网络获得了最高的结果(请参见MNISTILSVRCKaggle Galaxy Challenge)。它们似乎比“计算机视觉”中的所有其他方法都要好。但是,还有其他任务:

我对ASR(自动语音识别)和机器翻译不太确定,但我想我还听说过(递归)神经网络(开始)胜过其他方法。

我目前正在学习贝叶斯网络,我想知道在哪些情况下通常会使用这些模型。所以我的问题是:

在贝叶斯网络或至少非常相似的模型方面,是否存在任何挑战/(竞争)竞争?

(附注:我也看到了决策树234567胜在最近的几Kaggle挑战)


这不是领域的问题。这是一个问题,即您拥有多少数据,先验情况如何以及是否需要后继者。
Emre

1
@Emre这是一个域问题……(当然,如果您不仅有可能使用现有数据集,而且还可以雇用人员来创建/标记新数据,那么这是金钱)。
Martin Thoma

如果数据具有某种属性,某种结构,那么一种算法要比另一种算法要好得多,这将是一个域的问题,但这并不是我的建议。
Emre'1

2
因此,您的问题的答案是,。对?因为所有答案似乎都指出了贝叶斯网络相对于其他预测模型的优势,但是我还没有见过任何Kaggle竞争,它们实际上胜过其他模型。谁能提供一个?因为答案中给出的所有原因和可能的优点(例如,缺少足够的数据和选择良好的先验条件)在理论上似乎是不错的选择,但至少通过提供一个示例,仍然不能回答问题。
MNLR

贝叶斯网络的一件事对于数据量相对有限的无监督学习/任务很有用。只有要训练大量数据时,神经网络才能胜过其他人。
xji

Answers:


31

贝叶斯方法经常被使用的领域之一是需要预测系统的可解释性。您不想给医生一个神经网络,说它是95%准确的。您宁愿解释您的方法所做的假设以及该方法使用的决策过程。

类似的领域是您具有很强的先验领域知识并想在系统中使用它。



参见:石灰
马丁托马

18

贝叶斯网络和神经网络不是彼此排斥的。实际上,贝叶斯网络只是“定向图形模型”的另一个术语。它们在设计目标函数神经网络时非常有用。Yann Lecun在这里指出了这一点:https : //plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq

一个例子。

pX=žpX|žpždž
pX|žqž|Xpž|X

这两个部分可以一起培训吗?
nn0p

16

已经很好的答案。

我可以想到并且正在广泛使用的一个领域是客户分析领域。

为了通知和警告客户支持,营销和成长团队,我必须了解并预测客户的举动和动机。

因此,在这里,神经网络在用户流失预测等方面做得非常好。但是,我发现并喜欢贝叶斯网络风格,这是我们偏爱它的原因:

  1. 客户总是有模式的。他们总是有一个原因行动。这就是我的团队为他们所做的事情,或者他们已经学会了。因此,这里的一切都具有先验性,事实上,原因非常重要,因为它推动了客户做出的大多数决定。
  2. 客户和增长团队在营销/销售漏斗中的一举一动都是因果关系。因此,在将潜在客户转化为客户方面,先验知识至关重要。

因此,在涉及客户分析时,先验的概念非常重要,这使得贝叶斯网络的概念对该领域非常重要。


建议学习:

神经网络的贝叶斯方法

商业分析中的贝叶斯网络


15

有时,您与更改结果一样在乎预测结果。

具有足够训练数据的神经网络将倾向于更好地预测结果,但是一旦您可以预测结果,则可能希望预测输入特征发生变化对结果的影响。

现实生活中的一个例子很重要,那就是知道某人可能会心脏病发作,但是能够告诉该人,如果他们停止做XX,则风险会降低30%。

同样对于客户保留而言,知道为什么客户停止与您购物的价值与预测可能停止与您购物的客户一样有价值。

同样,较简单的贝叶斯网络预测的效果较差,但会导致采取更多的措施,通常可能比更“正确”的贝叶斯网络更好。

贝叶斯网络相对于神经网络的最大优势在于,它们可用于因果推理。该分支对于统计和机器学习至关重要,并且Judea Pearl 因这项研究而获得了图灵奖


但是神经网络也可以用来确定不同功能的作用和重要性,对吗?
侯赛因

7

在小数据设置下,贝叶斯网络可能会优于神经网络。如果先验信息是通过网络结构,先验信息和其他超参数正确管理的,则它在神经网络上可能具有优势。众所周知,神经网络,尤其是具有更多层的神经网络,数据匮乏。根据定义,几乎所有数据都是正确训练它们所必需的。


4

我已经在Reddit上发布了此链接,并获得了很多反馈。有些人在这里发布了答案,其他人没有。这个答案应该总结reddit的帖子。(我把它做成社区维基,所以我没有得到分数)



2

我为此做了一个小例子。由此看来,如果您想捕获分布,但我认为贝叶斯网络是首选,但您的输入训练集不能很好地覆盖该分布。在这种情况下,即使泛化得很好的神经网络也无法重构分布。


-3

我坚决不同意神经网络比其他学习者做得更好。实际上,与其他方法相比,神经网络的表现非常糟糕。尽管在选择参数方面有一些建议,但这种方法还是没有方法,这种选择是很偶然的。也有一些花花公子在论坛上随机谈论神经网络的性能如何,不是因为他们有关于神经网络的证据,而是因为他们对花哨和时髦的词``神经''很感兴趣。它们也非常不稳定,您是否尝试过将神经网络与xgboost进行比较?我不会尝试任何神经网络,直到它变得自觉。


3
这太含糊且难以交谈,无法做出正确的答案。一些细节,事实和编辑将改进它。
肖恩·欧文

,,``特定事实''应该由发布此类消息的人指定,例如说神经网络是最好的,您不能说神经网络做得很好只是因为它们听起来不错,神经网络中也有数据集可能这样做以使knn获得更好的结果的方式变得很糟糕。
gm1

1
尽管我不否认您的观点,但您也不应认为您的回答并未真正回答问题。因此,请考虑将其添加为评论。并且,请添加任何具体的证据和理论来支持您的回答,否则将来的观众可能会
视而不见

1
@ gm1我想您的意思是“ ,, Specific facts”,应该由发布此类消息的人指定,例如说神经网络是最好的。请注意,我没有写过这么概括的声明。我写了NN在许多竞赛/简历任务中都赢了。而且,我还为神经网络方法赢得了很多挑战。
Martin Thoma

嗨,那里当然有一些Kaggle比赛,其中神经网络做得很好(假设他们没有将神经网络与其他模型结合使用),但这只是所有kaggle比赛的一小部分,可以使用神经网络进行吗?我认为我能够使用非线性模型对公共和私有LB做到前三。
gm1
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.