要决定使用哪个点预测误差度量,我们需要退后一步。请注意,我们对未来的结果并不完全了解,也永远不会。因此,未来结果遵循概率分布。有些预测方法会显式输出这样的完整分布,而有些则不会-但即使只是隐式,也总是存在。
现在,我们希望对点预测具有良好的误差度量。这样的点预测Ft是我们尝试使用单个数字(即所谓的未来密度函数)来总结我们在时间t处对未来分布(即预测分布)的了解。然后,错误度量是评估此单个数字摘要的质量的一种方法。
因此,您应该选择一种误差度量,以奖励“好”的(未知,可能是预测的,但可能只是隐式的)未来密度的摘要。
挑战在于,通过不同的功能将不同的错误度量最小化。通过未来分配的预期值将预期的MSE最小化。预期MAD由未来分配的中位数最小化。因此,如果您校准预测以最小化MAE,则点预测将是将来的中位数,而不是将来的预期值,并且如果将来的分配不对称,则预测将有偏差。
这与通常偏斜的计数数据最相关。在极端情况下(比如,服从泊松分布的销售,平均低于log2≈0.69),您的MAE会为一个单位零预测是最低的。有关详细信息,请参见此处或此处或此处。
我在“平均绝对百分比误差(MAPE)的缺点是什么?”中提供了更多信息和说明。该线程考虑了mape,还考虑了其他错误度量,并且包含指向其他相关线程的链接。
最后,要使用哪种错误衡量标准实际上取决于您的预测错误成本,即哪种错误最痛苦。不考虑预测误差的实际含义,任何有关“更好的标准”的讨论基本上是没有意义的。
几年前,预测准确性的度量是预测社区中的一个大话题,并且时不时地出现。Hyndman&Koehler是一篇非常好的文章,“另一种关于预测准确性的度量”(2006年)。
最后,一种替代方法是计算完整的预测密度,并使用适当的评分规则对其进行评估。