我们可以将贝叶斯定理写成
其中是后验的,是条件分布的,而是先验的。
要么
其中是后验的,是似然函数,而是先验的。
我的问题是
- 为什么要使用似然函数而不是条件分布来进行贝叶斯分析?
- 您能否用语言说出可能性与条件分布之间的区别是什么?我知道可能性不是概率分布和。
我们可以将贝叶斯定理写成
其中是后验的,是条件分布的,而是先验的。
要么
其中是后验的,是似然函数,而是先验的。
我的问题是
Answers:
假设您有随机变量(其值将在实验中观察到),它们是有条件独立的,假定且条件密度为,对于。这是你的(假设)的统计(条件)模型和条件密度表达,对每一个可能值的(随机)参数,你对的价值的不确定性的,之前你有机会获得任何真实数据。借助条件密度,例如,您可以计算条件概率,例如 Θ = θ ˚F X 我 | Θ(我= 1 ,... ,Ñ θ Θ X 我 P { X 1 ∈ 乙1,... ,X Ñ ∈ 乙Ñ | Θ = θ } = ∫ 乙1 × ⋯ × 乙Ñ Ñ Π我= 1个 ˚F X 我 | θ(X 我 | θ )θ
在访问了在一次实验中观察到的值(实现)的实际样本之后,情况发生了变化:可观察物不再具有不确定性。假设随机假定某个参数空间。现在,您为那些已知的(固定的)值一个函数 由 请注意,称为“似然函数”的是X 我X 1,... ,X Ñ Θ Π (X 1,... ,X Ñ)大号X 1,... ,X Ñ:Π →交通ř
在回答您的问题时,要了解条件密度和似然性概念之间的区别,请记住它们的数学定义(它们明显不同:它们是具有不同属性的不同数学对象),并且还请记住,条件密度是“样本”对象/概念,而可能性是“样本后”。我希望所有这些也能帮助您回答为什么贝叶斯推理(使用您认为的方式,我认为不理想)是“使用似然函数而不是条件分布”完成的:贝叶斯推理的目标是计算后验分布,并以此为条件,以观察到的(已知)数据为条件。
贝叶斯分析通常通过对贝叶斯定理的更简单陈述来完成,在贝叶斯定理中,我们仅在相对于感兴趣参数的比例方面进行工作。对于具有采样密度的标准IID模型,我们可以表示为:
贝叶斯更新的这一陈述是根据相对于参数的比例关系来进行的。它使用两种比例简化:一种是使用似然函数(与采样密度成比例),另一种是使用后验(与似然和先验乘积成比例)。由于后验是密度函数(在连续情况下),因此规范规则会设置产生有效密度(即使其积分为一)所需的乘法常数。
这种使用比例的方法的优点是允许我们忽略不依赖于参数的函数的任何乘法元素。通过允许我们清除掉数学中不必要的部分,并获得更新机制的更简单的陈述,这倾向于简化问题。这不是数学上的要求(因为贝叶斯规则也以其非比例形式起作用),但是对于我们的小动物大脑来说,事情变得更简单了。
一个应用示例:考虑一个具有观测数据的IID模型。为了方便我们的分析,我们定义统计信息和,这是前两个采样时刻。对于此模型,我们具有采样密度:
现在,如果需要,我们可以直接使用此采样密度。但是请注意,此密度的前两项是不依赖乘法常数。不得不跟踪这些术语很烦人,所以让我们摆脱它们,这样我们就有了似然函数:
因为我们不必跟踪另一个术语,所以这简化了一些事情。现在,我们可以使用包括完整分母在内的完整方程式应用贝叶斯规则。但是再次,这要求我们跟踪另一个不依赖令人讨厌的乘法常数(更令人讨厌的是,因为我们必须解决一个积分问题才能得到它)。因此,让我们以比例形式应用贝叶斯规则。使用共轭先验和一些已知的精度参数,我们得到以下结果(通过完成平方):
因此,从这项工作中我们可以看到,后验分布与正态密度成正比。由于后验必须是密度,这意味着后验是正常密度:
因此,我们看到,后验参数通常是由给定后的均值和方差分布:
现在,我们得出的后验分布在其前部具有一个积分常数(我们可以通过查找正态分布的形式轻松地找到它)。但是请注意,我们不必担心这个乘法常数-只要简化数学运算,我们所有的工作都将删除(或引入)乘法常数。在跟踪乘法常数的同时,可以得出相同的结果,但这要麻烦得多。