根据我读过的几篇论文,书籍和文章,给我的印象是,将概率分布拟合到一组数据上的推荐方法是使用最大似然估计(MLE)。但是,作为物理学家,一种更直观的方法是仅使用最小二乘法将模型的pdf与数据的经验pdf拟合。那么为什么MLE在拟合概率分布上比最小二乘更好?有人可以指出我要回答该问题的科学论文/书吗?
我的直觉是因为MLE没有假定噪声模型,而经验pdf中的“噪声”是异方差的,不是正常的。
根据我读过的几篇论文,书籍和文章,给我的印象是,将概率分布拟合到一组数据上的推荐方法是使用最大似然估计(MLE)。但是,作为物理学家,一种更直观的方法是仅使用最小二乘法将模型的pdf与数据的经验pdf拟合。那么为什么MLE在拟合概率分布上比最小二乘更好?有人可以指出我要回答该问题的科学论文/书吗?
我的直觉是因为MLE没有假定噪声模型,而经验pdf中的“噪声”是异方差的,不是正常的。
Answers:
考虑这一点的一种有用方法是注意,在最小二乘和MLE相同的情况下,例如在随机元素具有正态分布的情况下估计参数。因此,实际上,不是(如您所推测的那样)MLE没有假设噪声模型,而是在假设确实存在随机噪声,而是更复杂地了解其形状,而不是假设具有正态分布。
任何有关统计推断的教科书都将涉及MLE在效率和一致性(但不一定是偏见)方面的优良特性。MLE还具有在合理的一组条件下渐近正常的良好特性。