如果我有一个训练数据集,并且在上面训练了一个朴素贝叶斯分类器,并且我的属性值的概率为零。如果以后要预测新数据的分类,该如何处理?问题是,如果计算中为零,则整个乘积将变为零,无论我得到多少其他值(也许会找到其他解决方案)。
例:
整个乘积变为因为在我们的小型培训数据集中,在培训数据中,TimeZone US属性始终为“是”。我该如何处理?我应该使用更多的训练数据集还是有另一种可能性可以克服这个问题?
如果定义出现离散属性值,则其概率不能为零。
—
保罗
为什么我们要在0频率中加1,这背后的逻辑是什么?为什么不加上另一个数字。
—
Aftab Hussaiin