Answers:
ML估算器会得出最有可能在数据集中出现的参数值。
给定假设,ML估计量就是最有可能产生数据集的参数值。
我无法从直觉上理解偏向ML估计器,即“参数的最可能值如何通过偏向错误值来预测参数的实际值?”
偏差是关于样本分布的期望。“最有可能产生数据”与对采样分布的期望无关。为什么期望他们在一起?
令人惊讶的是它们不一定对应的基础是什么?
我建议您考虑一些简单的MLE案例,并思考在这些特定案例中差异是如何产生的。
例如,考虑在上的均匀观测。最大的观测值(不一定)不大于参数,因此参数只能采用至少与最大的观测值一样大的值。
当考虑的似然性时,(显然)θ越接近最大观测值,它的可能性就越大。因此,在最大观察值时将其最大化;显然,这是对θ的估计,它最大程度地增加了获得样本的机会:
这位于MLE的右侧,因此可能性较低。