关于罗比·麦克基利姆(Robby McKilliam)的评论:我认为常客会遇到的困难在于“先验知识”的定义,而不是将先验知识纳入模型的能力。例如,考虑估计给定硬币出现的概率。让我们假设我的先验知识本质上是一个实验,其中那个硬币被翻转了十次,并带有5个头,或者可能是“工厂制造了100万个硬币,而的距离为通过大量实验确定的是β (a ,b )pβ(a,b)“。当您确实确实拥有这种类型的先验信息时,每个人都会使用贝叶斯规则(贝叶斯规则仅定义条件概率,而不仅仅是贝叶斯方法),因此在现实生活中,常客和贝叶斯将使用相同的方法,并且通过贝叶斯规则将信息合并到模型中(注意:除非您的样本量足够大,否则您可以肯定先前的信息不会对结果产生影响。)但是,结果的解释是当然,不同。
随着知识的客观性/实验性和主观性的降低,尤其是从哲学的角度来看,这引起了困难。发生这种情况时,常驻者可能根本不会倾向于将这些信息纳入模型中,而贝叶斯主义者仍然有一些或多或少的形式化机制可以这样做,尽管存在主观先验的困难。
关于正则化:考虑似然和先验p (θ )。至少从技术上讲,没有什么可以阻止常客使用通过log p (θ ) “正规化”的最大似然估计,如:l(θ;x)p(θ)logp(θ)
θ~=maxθ{logl(θ;x)+logp(θ)}
对于高斯,这等于向高斯平均数的平方惩罚收缩θ,对于其他分布,依此类推。p(θ)θθ~
同样,困难是从哲学的观点出发的。为什么选择一个正则化函数而不是另一个?贝叶斯可以通过评估先验信息来做到这一点-转向基于先验的观点。一名常客将很难(无法?)证明基于这些理由的选择,但取而代之的可能主要是基于正则化函数的属性,该正则化函数适用于他/她的问题类型,这是从联合中获悉的。许多统计学家的工作/经验。OTOH,(务实的)贝叶斯主义者也用先验来做到这一点-如果我已经读过每张关于先验方差的论文,而我有100美元……
其他“想法”:假设可能性函数/贝叶斯观点不受影响,我跳过了选择似然函数的整个问题。我敢肯定,在大多数情况下是这样,但是我可以想象,在特殊情况下,例如出于计算原因,情况确实如此。
θθ