人为全球变暖的证据达到“黄金标准”:他们是如何做到的?


35

Reuter在2019年2月25日发表的文章中的这一消息目前已成为新闻:

人为全球变暖的证据达到“黄金标准”

[科学家]说,人们对人类活动正在升高地球表面的热量的信心达到了“五西格玛”水平,这是一个统计量表,这意味着只有在这种情况下,如果存在没有变暖。

我相信这是指本文“庆祝气候变化科学三大关键事件的周年纪念日”,其中包含一个图,如下图所示(这是一个草图,因为我找不到原始的,类似的开源图像免费图片在这里找到)。来自同一研究小组的另一篇文章似乎是更原始的来源(此处使用1%的有效度而不是)。5σ


该图显示了三个不同研究组的测量结果:遥感系统,卫星应用和研究中心以及位于汉斯维尔的阿拉巴马大学。

该图显示了信噪比随趋势长度变化的三个上升曲线。

人为信号

所以,在某种程度上科学家在测量了全球变暖(或气候变化?)的人为信号水平,这显然是一些证据的科学标准5σ

对我来说,这样的图具有很高的抽象水平,它引发了许多问题,并且总的来说,我对“他们是如何做到的?”这个问题感到好奇。我们如何用简单的单词(不是那么抽象)来解释这个实验,又如何解释级别的含义?5σ

我在这里问这个问题是因为我不想讨论气候。相反,我想要有关统计内容的答案,尤其是要弄清楚使用/声明的语句的含义5σ


什么是原假设?他们如何设置实验以获得人为信号?信号的影响大小是多少?只是一个很小的信号,而我们现在只是因为噪声在减小而测量,还是信号在增大?为创建统计模型做出什么样的假设,通过它们它们可以确定5 sigma阈值的交叉点(独立性,随机效应等)?为什么不同研究组的三个曲线不同,它们具有不同的噪声还是具有不同的信号?对于后者,对于概率和外部有效性的解释意味着什么?


2
@MattF。我的期望是,有可能做出一个简单的解释来解释这里使用的阈值的统计概念(至少是高能粒子物理学家,他们也使用差异/效应来描述信号)。事件计数中的噪声比率,对此没有问题)。简单来说,我的意思是从气候学术语中剥离出一些东西,但是足够复杂以包含本质。假设这是为专业统计学家和数学家编写的,这样他们就可以在这里理解。5σ5 σσ5σ
Sextus Empiricus

1
强调与高能物理学的对比:对于这一领域的统计学家来说,他们可以理解级别基本上是没有意义的,并且由于技术上的错误,该阈值设置得很高(1.别处的效果2.错误的错误假设)忽略系统影响的分布3.隐式地进行贝叶斯分析,“非常大的主张需要非凡的证据”)。5σ
Sextus Empiricus

1
问题是,在这幅人造的全球变暖文章中,这三种影响有多少?我认为,必须弄清楚这一点,以使科学主张神秘化,这一点很重要。仅将一些数字放入参数中以使其听起来很严格是很常见的,大多数人都停止质疑它。
Sextus Empiricus

2
您是否看到过以下评论:judithcurry.com/2019/03/01/…
罗伯特·朗·

2
巧合的是,几天前我正在阅读这些论文,现在注意到了您的新发现。我现在可以写点东西。
变形虫说恢复莫妮卡

Answers:


15

它并不总是与统计测试有关。它也可以与信息论有关。

术语5σ就是它所说的:“信号”与“噪声”之比。在假设检验中,我们有一个分布参数的估计值和该估计值的标准误。第一个是“信号”,第二个是“噪声”,统计量及其标准误的比率是z统计量,t统计量,F统计量,您可以为其命名。

然而,信噪比在我们通过某种噪声接收/感知某些信息的任何地方都是有用的。如引用的链接所解释

信噪比(通常缩写为SNR或S / N)是科学和工程学中用来量化信号受噪声破坏程度的一种度量。

在我们的案例中,“信号”是大气中某些层的温度的实际测量变化,“噪声”是模拟的变化预测,没有已知的人为影响。碰巧这些模拟以一定的标准偏差σ预测了或多或少的静止温度。

现在回到统计。所有测试统计量(z,t,F)都是估计值与其标准误的比率。因此,当统计学家听到诸如S / N之类的信息时,我们就认为z统计量具有概率。气候学家显然不这样做(文章中没有提到概率)。他们只是发现变化是预期的“大约三到八倍”,信噪比为3σ至8σ。

哪些物品被报道是,它们由两种模拟:与那些包含在模型已知的人类活动的影响和其他与排除已知的人类活动的影响。第一次模拟与测得的实际卫星数据相似,而第二次模拟则遥遥无期。如果这可能与否,他们不会说,显然不在乎。

回答其他问题。他们没有进行任何实验,而是根据自己的模型进行了仿真。因此,除了显而易见的零假设外,没有任何明确的零假设,即变化与预期相似(S / N为1)。

信号的影响大小是实际数据与仿真之间的差异。该信号比预期大5倍(通常是温度变化的5倍)。由于测量的数量和可能的准确性,似乎噪声正在降低。

与我们对“真正的科学家”的期望相反,没有可以谈论的统计模型,因此有关假设的问题是虚无的。唯一的假设是他们的模型使他们能够预测气候。这与说用于天气预报的模型是可靠的一样有效。

还有三个以上的曲线。它们是来自不同模型的仿真结果。他们只是必须有所不同。是的,有不同的噪音。就信号而言,它们是不同的测量集,它们具有测量误差,并且也应该是不同的。这对解释意味着什么?S / N的概率解释不是一个好方法。但是,调查结果的外部有效性是合理的。他们只是断言,当考虑到已知的人为影响时,1979年至2011年期间的气候变化与模拟可比,并且比从模型中排除已知的人为因素时模拟所计算的气候变化大约大五倍。

因此,还有一个问题。如果气候学家要求统计学家建立模型,那应该是什么?我认为这是布朗运动的产物。


那么,什么构成“信号”,“噪声”的本质是什么,我们可以归因于哪些看不见的过程呢?
乔什(Josh)

1
Sory @Josh,我过早按下了发送按钮。现在您可以阅读我的完整答案。当从模型中排除已知的人为因素时,“信号”或多或少是实际测量值,“噪声”是模拟结果。我认为这是非常不合逻辑的……
Nino Rode

1
其次,我从您的帖子中得到的是,S / N统计量由信号确定:两个理论模型之间的差异(人为作用与基线之间)和噪声:这些理论模型内的偏差。但是,这可能会受到系统性影响的极大影响。通过简单地对蒙特卡罗模拟中的方差求平均值并不能很好地确定随机效应的分布(请参阅Vivianonium粒子)。如果存在系统错误,则可以通过收集更多数据来使差异最大。nσ
Sextus Empiricus

3
@NinoRode也许我错过了一些东西,但是由于没有人为影响的“噪声”模型显然是错误的,这是由于基于经验测量得出的平均温度升高了,该模型如何提供相关的基线?由于可以理解,除了人为因素外,温度还会由于自然过程(en.wikipedia.org/wiki/Little_Ice_Age)而波动,因此,假设“噪声”模型在整个过程中温度均值应为零的基础是什么?分析期?
乔什

1
@Scott,聪明的卡通漫画的问题是,在时间序列中没有显示噪音,因为可能无法精确地确定测量结果,无法确定某个世纪(更不用说特定年份)的温度了。因此,在现代测量设备问世之前,它看起来是平滑且渐变的。在流体力学中,这就像将速度场的瞬时观测值与雷诺平均的观测值进行比较。这是不合适的比较。除非您真的认为,在Greta Thunberg出生之前,全球温度的波动基本上为零。:)
乔什

11

警告:我不是气候学专家,这不是我的专业。请记住这一点。欢迎更正。


您所指的数字来自Santer等人的最新论文2019年,庆祝《自然气候变化》Nature Climate Change)气候变化科学三大关键事件的周年纪念日。它不是研究论文,而是简短的评论。该图是同一作者Santer等人先前在《科学》杂志上发表的类似图的简化更新。2018年,人类对流层温度季节周期的影响。这是2019年的数字:

在此处输入图片说明

这是2018年的数字; 面板A对应于2019年的数字:

在此处输入图片说明

在这里,我将尝试解释最后一个数字(所有四个面板)背后的统计分析。该科学论文是开放获取的,并且可读性强。统计细节照常隐藏在补充材料中。在讨论这样的统计数据之前,必须先对这里使用的观测数据和模拟(气候模型)说几句话。


1.资料

缩写RSS,UAH和STAR是指根据卫星测量结果对流层温度的重建。自1979年以来,使用气象卫星对对流层温度进行了监测:有关MSU温度测量的信息,请参阅Wikipedia。不幸的是,这些卫星不能直接测量温度。他们测量其他东西,从中可以推断出温度。此外,已知它们遭受各种与时间有关的偏差和校准问题。这使得重建实际温度成为困难的问题。几个研究小组按照一些不同的方法进行了重建,并获得了一些不同的最终结果。RSS,UAH和STAR是这些重构。引用维基百科,

卫星不测量温度。它们测量各种波长带中的辐射,然后必须对其进行数学上的求逆以获得温度的间接推论。所得的温度曲线取决于用于从辐射度获得温度的方法的细节。结果,分析卫星数据的不同小组获得了不同的温度趋势。这些小组中有遥感系统(RSS)和位于汉斯维尔的阿拉巴马大学(UAH)。卫星序列不是完全同质的-记录是由一系列具有相似但不相同仪器的卫星构成的。传感器会随着时间的流逝而变坏,因此有必要对卫星在轨道上的漂移进行校正。

关于哪种重建更可靠存在很多争论。每个小组不时更新其算法,从而更改整个重建的时间序列。例如,这就是为什么RSS v3.3与上图中的RSS v4.0不同的原因。总体而言,AFAIK在全球范围内公认的是,与卫星测量值相比,全球表面温度的估计值更为精确。无论如何,对这个问题重要的是,从1979年到现在,有几个可用的空间分辨对流层温度的估计值,即作为纬度,经度和时间的函数。

T(x,t)

2.型号

可以运行多种气候模型来模拟对流层温度(也取决于纬度,经度和时间)。这些模型将CO2浓度,火山活动,太阳辐射,气溶胶浓度和各种其他外部影响作为输入,并以温度作为输出。利用实际测得的外部影响,这些模型可以在同一时间段(1979年至今)运行。然后可以将输出平均,以获得平均模型输出。

人们也可以运行这些模型而无需输入人为因素(温室气体,气溶胶等),从而获得非人为模型预测的想法。请注意,所有其他因素(太阳能/火山等)均在其平均值附近波动,因此非人为模型的输出在构造上是固定的。换句话说,这些模型不允许气候在没有任何特定外部原因的情况下自然变化。

M(x,t)N(x,t)

z

ŤXŤ中号XŤñXŤ

ŤX一世中号X一世ñX一世一世

  1. 年均值:只是全年的平均温度。
  2. 年度季节周期:夏季温度减去冬季温度。
  3. X一世
  4. 减去全球平均数的年度季节周期:与(2)相同,但再次减去全球平均数。

中号X一世FX

ŤX一世FX

ž一世=XŤX一世FX
βž

w ^一世=XñX一世FX
βñØ一世sËβñØ一世sËž-统计:

ž=βVar1个/2[βñØ一世sË]

ž

ž

4.一些评论

恕我直言,第一个指纹(面板A)最琐碎。它仅表示观测到的温度单调增长,而在原假设下的温度则不会单调增长。我认为没有人需要整个复杂的机制来得出这个结论。全球平均对流层较低温度(RSS变体)时间序列如下所示

在此处输入图片说明

显然这里有一个非常重要的趋势。我认为不需要任何模型就能看到这一点。

ž

ž


ž


2
(+1)个好答案!如果您不介意:是否可以扩展“跨时间点的PCA”步骤?我不理解在那里进行PCA而不是分别分析每个维度的想法。
mkt-恢复莫妮卡

β噪声

1
ñX一世FXŤX一世FXñX2019年

1
是的,可以从各种角度讨论这些东西。我个人通常对任何方面都没有太多的判断力,但是我确实喜欢那种论点清晰明了。关于气候的报告目前非常模糊。
Sextus Empiricus

1
FX
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.