(我是统计工作的新手。我是数学家和程序员,我正在尝试构建类似朴素的贝叶斯垃圾邮件过滤器的工具。)
我注意到许多地方人们倾向于分解贝叶斯定理方程中的分母。所以代替这个:
我们看到了这个:
您可以看到此约定在本Wikipedia文章和Tim Peters的这篇有深刻见解的帖子中使用。
我对此感到困惑。为什么分母会这样分解?这对一切有什么帮助?计算有何复杂之处?对于垃圾邮件过滤器而言,这将是什么?The probability that the word "cheese" appears in an email, regardless of whether it's spam or not