我在回顾一些旧的统计数据时有一种奇怪的想法,由于某种原因,我似乎无法想到答案。
连续的PDF告诉我们在任何给定范围内的观测值的密度。即,如果,例如,则概率一个实现落在之间和是简单地,其中是标准正态的密度。
当我们考虑对参数(例如进行MLE估计时,我们写出了(随机变量的联合密度。。X N并将对数似然比wrt区分为,设置为0并求解。通常给出的解释是“给定数据,该参数使该密度函数最合理”。
让我烦恼的部分是:我们的密度为 rv,我们的样本表示,获得特定实现的概率恰好为0。在给定数据的情况下,为什么最大化关节密度甚至有意义(因为再次观察到我们实际样本的概率恰好是0)?
我能想到的唯一合理化方法是,我们希望使PDF 在我们观察到的样本周围尽可能达到峰值,以使该区域中的积分(从而观察该区域中的东西的概率)最高。