Answers:
为什么使用贝叶斯分类器可以达到可以实现的最佳性能?对此的正式证明/解释是什么?
通常,数据集被视为由生成数据的分布的 iid样本组成。然后,根据给定的数据构建预测模型:给定样本,您预测类,而样本的真实类为。˚F(X 我)˚F (X 我)
但是,从理论上讲,您可以决定不选择一个特定的模型,而是立即考虑所有可能的模型并将它们以某种方式组合为一个大模型。 ˚F ˚F
当然,给定数据,许多较小的模型可能不太可能或不合适(例如,即使数据集有多个目标值,这些模型也只能预测目标值之一)。
无论如何,您都希望预测新样本的目标值,这些样本取自与相同的分布。一个很好的措施模型的性能将是
即概率,你预测随机采样真实目标值。
使用贝叶斯公式,您可以计算出给定数据,新样本具有目标值的概率为:
因此,在大多数情况下很难获得/估计。
现在,我们进入最佳贝叶斯分类器。对于给定的,它预测值
由于这是所有可能的目标值最可能出现的值,因此最优贝叶斯分类器将性能指标最大化。
由于我们始终使用贝叶斯分类器作为基准来比较所有其他分类器的性能。
可能是您使用了朴素的贝叶斯分类器。它易于实现,在大多数情况下都能正常工作,但仅计算估计。