内特·西尔弗(Nate Silver)对黄土的评论


23

我最近问的一个问题中,有人告诉我,用黄土推断是一个很大的“不可以”。但是,在Nate Silver在FiveThirtyEight.com上的最新文章中,他讨论了使用黄土做出选举预测。

他当时在讨论黄土侵略性与保守性预报的细节,但我对黄土做出未来预测的有效性感到好奇吗?

我也对这次讨论以及对黄土可能有类似好处的其他替代方法感兴趣。


如果您的x变量是时间,那么使用黄土来预测未来(这将超出数据范围)是危险的。但这并不意味着您不能使用黄土来进行更广泛的预测。
Glen_b-恢复莫妮卡

出于好奇,@ Glen_b我可以“更一般地”预测什么?
a.powell '16

7
想象一下倾向于投票支持甲方的人口比例与失业率之间的非线性关系(以及其他预测因素,例如对各个州的影响)。进一步想象一下,新的失业数据即将公布。在培训组经历的值的范围内,但不一定是该组所代表的值(例如,过去的失业率在5%至12%之间,现在我们的数字为8.3%,预计将保持稳定)。然后,我们可以使用黄土来预测投票A的比例,而不会超出5-12%的失业率。
Glen_b-恢复莫妮卡

1
@Glen_b谢谢。这很好地说明了如何将其用于预测。
a.powell '16

Answers:


28

最低或最低的问题是它使用多项式插值法。预测多项式尾部行为不稳定是众所周知的。进行插值时,分段的三阶多项式可提供趋势的出色且灵活的建模,而在观察数据范围之外进行插值则会爆炸。如果您在时间序列中观察到了以后的数据,则肯定需要在样条曲线中包含另一个断点才能获得良好的拟合度。

但是,预测模型已在文献中的其他地方得到了很好的探索。卡尔曼滤波器和粒子滤波器之类的滤波过程可提供出色的预测。基本上,一个好的预测模型将是基于马尔可夫链的任何事物,其中时间不被视为模型中的参数,而是使用先前的模型状态来告知预测。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.