似然函数不是pdf(概率密度函数)的原因是什么?
似然函数不是pdf(概率密度函数)的原因是什么?
Answers:
我们将从两个定义开始:
甲概率密度函数(pdf)是集成到一个非负函数。
可能性定义为观察数据的联合密度随参数的变化。但是,正如@whuber在下面的评论中对Lehmann的引用所指出的那样,似然函数仅是参数的函数,并且数据保持为固定常数。因此,密度是数据的函数这一事实是无关紧要的。
因此,似然函数不是pdf,因为它相对于参数的积分不一定等于1(实际上,如@whuber的另一条评论所指出的那样,可能根本不可积分)。
看到这一点,我们将使用一个简单的示例。假设您从分布中得到一个观测值。那么似然函数是B e r n o u l l i(θ )
是事实。具体来说,如果,则,因此X = 1 大号(θ )= θ ∫ 1 0大号(θ )d θ = ∫ 1个0 θ d θ = 1 / 2
当时,适用类似的计算。因此,不能是密度函数。升(θ )
可能比表明为什么这种可能性不是概率密度的技术示例更为重要,是指出这种可能性不是参数值正确的概率或类似的东西,而是数据的概率(密度)。给定参数value,这是完全不同的事情。因此,不应期望似然函数的行为像概率密度。
可以,但是似然函数是给定参数的观测数据的联合概率密度。这样,可以将其归一化以形成概率密度函数。因此,它本质上就像是pdf。
我不是统计学家,但我的理解是,尽管似然函数本身不是关于参数的PDF,但贝叶斯规则直接将其与该PDF相关。似然函数P(X | theta)和后验分布f(theta | X)紧密相关;根本不是“完全不同的事情”。
可能性定义为,其中如果f(x;θ)是概率质量函数,则似然度始终小于1,但是如果f(x;θ)是概率密度函数,则由于密度可以大于1,因此似然度可以大于1。
通常,样本会被iid处理,然后:
让我们看看它的原始形式:
根据贝叶斯推断,成立,即。请注意,最大似然估计将证据与先验的比率视为一个常数(请参阅此问题的答案),这忽略了先验的信念。可能性与后验具有正相关,后者基于估计的参数。可能是pdf,但却不是,因为只是的一部分,很难处理。 大号大号
例如,我不知道高斯分布的均值和标准方差,而是想通过使用来自该分布的大量样本进行训练来获得它们。我首先随机初始化均值和标准方差(定义高斯分布),然后取一个样本并拟合估计的分布,然后从估计的分布中获得概率。然后,我继续放入样本并获得许多概率,然后将这些概率相乘并得到一个分数。这种分数是可能性。几乎不可能是某个pdf的概率。