我的天气预报员准确吗?


20

一个困扰我一段时间的问题,我不知道该如何解决:

每天,我的气象员都会有一定百分比的降雨机会(假设计算得出的数字为9000位数,而他从未重复输入数字)。随后的每一天,要么下雨,要么不下雨。

我有多年的数据-pct机会还是下雨。考虑到这位气象员的历史,如果他今晚说明天的下雨机会是X,那么我对下雨的真正可能性的最佳猜测是什么?


这与过去的问题有关:stats.stackexchange.com/q/2275/495
Simon Byrne

需要考虑的因素:在内特·西尔弗(Nate Silver)关于预测的书中,“信号与噪声:为什么这么多的预测失败了-但有些则不然”,他详尽地谈到了气象员出于营销原因如何定期调整降雨预报。NOAA不会,但是天气频道相当开放,可以将5到20到20之间的任何机会修改(以免在确实下雨的时候激怒顾客),而当地电视台的天气预报员通常会大肆宣传他们的身材。这种有意识的和可能不道德的偏见将影响对其预测质量的任何统计评估。
SQLServerSteve

Answers:


6

实际上,您正在考虑一个模型,其中降雨的真实机会p预测机会q的函数:p = p(q)。每次进行预测时,您都会观察到伯努利变量具有成功概率p(q)的一种实现。如果您愿意将真实机会建模为基本函数f1f2,...,fk的线性组合,则这是经典的逻辑回归设置。也就是说,模型说

Logit(p)= b0 + b1 f1(q) + b2 f2(q) + ... + bk fk(q) + e

有错误错误e。如果您对关系的形式不了解(尽管天气预报员的p(q)很好-q应该相当小),请考虑使用一组样条曲线作为基础。通常,输出包括系数的估计和e的方差的估计。给定将来的任何预测q,只需将值与估计的系数一起插入模型即可获得问题的答案(如果愿意,可以使用e的方差围绕该答案构建预测间隔)。

该框架足够灵活,可以包括其他因素,例如预测质量随时间变化的可能性。它还可以让您测试假设,例如是否p = q(这是气象员暗中要求的)。


嗯-我的问题不是很清楚。我唯一能做的就是为q()选择一些模型,该模型允许设置参数,并通过摆弄这些参数来最大化拟合的优度。那就是-无论我做什么,我都必须对q()的基本外观做出一些假设。
Paul Murray

11

二元事件(或离散随机变量)的概率预测的比较可以根据Brier分数进行

但您也可以使用ROC曲线, 因为任何这种类型的概率预测都可以转换为阈值不同的判别过程。实际上,如果您的概率大于ττ

您应该看看欧洲中程天气预报中心(中心 ECMWF的情况)。


3

当天气预报说“(地区)降雨的概率为X百分比”时,表示数值天气模型已针对该时间间隔以该地区X百分比的比例表示降雨。例如,通常可以预测“北美下雨的机会是100%”。请记住,这些模型善于预测动力学,而善于预测热力学。


1
一个古老的话题,但是在OP中需要澄清的关键点是:当他们说自己有“或没有”数据要与该预测进行比较时,它们的意思是“在我家”还是“在预测之内”区域”?
韦恩

2

布赖尔分数的做法很简单,最直接适用的方式验证预测的结果与二进制事件的准确性。

不要仅仅依靠公式...绘制不同时间段,数据,错误,数据的[加权]滚动平均值,错误的分数...很难说出可视化分析可能揭示的内容...您会看到一些东西,您将更好地知道要执行哪种假设检验,直到您之后 查看数据之后。

Brier分数固有地假设天气/技术的变化/基础分布的稳定性和驱动预测模型的要素,缺乏线性,没有偏差,偏差的变化...它假定相同的一般水平的准确性/不准确性是一致的。由于气候变化的方式尚不为人所知,天气预报的准确性将会降低;相反,向气象员提供信息的科学家拥有更多的资源,更完整的模型和更多的计算能力,因此也许预测的准确性将会提高。查看错误会告诉您有关预测的稳定性,线性和偏差的信息……您可能没有足够的数据来查看趋势。您可能会发现稳定性,线性和偏差不是问题。您可能会知道天气预报变得越来越准确...


0

仅对给定的预测进行分箱,然后将观察到的分数作为每个分箱的估计值怎么样?

您可以通过用高斯权衡您感兴趣的价值(假设明天的预测)周围的所有观察值,然后观察加权平均值,从而将其推广到一个连续模型。

您可以猜测一个宽度,以获取给定比例的数据(或者,一个良好的估计值,不小于100点)。或者,使用诸如最大似然的交叉验证之类的方法来获得高斯宽度。


0

您是否想知道他的预测是否比其他预测更准确?如果是这样,您可以查看概率分类的基本准确度指标,例如交叉熵,精确度/召回率,ROC曲线和f1得分。

确定预测是否客观上是另一回事。一种选择是查看校准。在他说会有90%的机会下雨的所有日子中,大约90%的日子里有下雨吗?在他有预报的所有日子里,然后根据他对下雨概率的估计,将其分类。对于每个存储桶,计算实际下雨天的百分比。然后针对每个桶,绘制实际下雨的概率与他对下雨概率的估计。如果对预测进行了很好的校准,该图将看起来像一条直线。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.