为什么贝叶斯分类器是理想的分类器?


11

这是理想的情况,其中可以很好地了解类别所依据的概率结构。

为什么使用贝叶斯分类器可以达到可以实现的最佳性能?

对此的正式证明/解释是什么?由于我们始终使用贝叶斯分类器作为基准来比较所有其他分类器的性能。

Answers:


9

为什么使用贝叶斯分类器可以达到可以实现的最佳性能?对此的正式证明/解释是什么?

通常,数据集被视为由生成数据的分布的 iid样本组成。然后,根据给定的数据构建预测模型:给定样本,您预测类,而样本的真实类为。dñX一世X一世˚FX ˚F X F^X一世FX一世

但是,从理论上讲,您可以决定不选择一个特定的模型,而是立即考虑所有可能的模型并将它们以某种方式组合为一个模型。F^选择 ˚F ˚FF^F^

当然,给定数据,许多较小的模型可能不太可能或不合适(例如,即使数据集有多个目标值,这些模型也只能预测目标值之一)。d

无论如何,您都希望预测新样本的目标值,这些样本取自与相同的分布。一个很好的措施模型的性能将是 即概率,你预测随机采样真实目标值。X一世Ë

Ë模型=P[FX=模型X]
X

使用贝叶斯公式,您可以计算出给定数据,新样本具有目标值的概率为:Xvd

Pvd=F^PvF^PF^d
人们应该强调的是

  • 通常为或,因为是的确定函数,PvF^01个˚F XF^X
  • 通常,但几乎所有时间,都无法估计(上述微不足道的情况除外),PF^d
  • 通常,但几乎所有时间,可能模型数量太大,无法评估上限。F^

因此,在大多数情况下很难获得/估计。Pvd

现在,我们进入最佳贝叶斯分类器。对于给定的,它预测值 由于这是所有可能的目标值最可能出现的值,因此最优贝叶斯分类器将性能指标最大化。X

v^=argmaxvF^PvF^PF^d
vËF^

由于我们始终使用贝叶斯分类器作为基准来比较所有其他分类器的性能。

可能是您使用了朴素的贝叶斯分类器。它易于实现,在大多数情况下都能正常工作,但仅计算估计。Pvd


贝叶斯分类器(不是朴素贝叶斯)与贝叶斯最优分类器相同吗?和是的先验概率?Pv|F
瑞奇

@RuiQi我不认为有这样的事情贝叶斯分类器。我知道朴素的贝叶斯分类器和最佳贝叶斯分类器。
Antoine

@RuiQi 是待分类的样本会落入类的概率v如果我们使用的预测模型。我猜,您可以称其为先验概率。PvF^vF^
Antoine

0

就分类器的成功率而言,性能与真实分类CŤ等于预测分类CP的概率有关。

您可以将该概率表示为特征向量X所有可能情况的积分(或X离散时的总和),并用条件概率对这些x进行正确分类X

PCŤ=CP=可能的 XFXPCŤ=CP|XdX

其中FX是特征向量X的概率密度。

如果对于某些可能的特征X,分类器没有为该特征集合选择最可能的类别,则可以对其进行改进。

贝叶斯分类器总是为每组特征X选择最可能的类别(项PCŤ=CP|X最大),因此至少在不基于特征X无法加以改进。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.