塔莱布与黑天鹅


63

塔莱布(Taleb)的书《黑天鹅》(The Black Swan)在几年前问世时是《纽约时报》的畅销书。这本书现在是第二版。在JSM(年度统计会议)上与统计学家会面后,Taleb在某种程度上减轻了对统计学的批评。但是本书的重点是统计数据不是很有用,因为它依赖于正态分布和非常罕见的事件:“黑天鹅”不具有正态分布。

您认为这是有效的批评吗?Taleb是否缺少统计建模的一些重要方面?至少可以在估计发生概率的意义上预测稀有事件吗?



2
另外,IMO,我不认为“黑天鹅”标签会非常有用。对于该特定作者而言,应避免使用IMO的内用术语。罕见的事件对我来说似乎足够了,但是您肯定会比我更了解行话。
安迪W

1
@AndyW虽然黑天鹅可能是塔勒布(Taleb)创造的一个术语,但它已成为罕见事件的常用术语,因此其含义可能不仅限于塔勒布(Taleb)的书。
Michael Chernick 2012年

2
创建“ black-swans”标签或“ rare-events”标签不一定会带来问题,但是,我强烈建议人们在创建新标签时至少创建一个标签维基摘录。未来的用户将需要一些有关标签含义和正确使用的指导。同时创建&立即使bs成为re的同义词可能也很有用,以避免将来意外遇到此问题。
gung

2
@kjetilbhalvorsen 的书我读了Benoit Mandelbrot关于财务的书,却无法克服《黑天鹅》中几乎所有的想法都存在,可以更好地解释并且毫无干扰的事实。这确实对塔勒布的“贡献”发出了不同的看法。
安东尼·帕雷拉达

Answers:


69

我几年前读过《黑天鹅》。Black Swan的想法很好,而且对荒谬谬误的攻击(把东西看成是骰子游戏,具有已知的概率)是好的,但统计数据却被错误地歪曲了,中心问题是错误的主张,即如果变量存在,所有统计数据都会崩溃不是正态分布的。这方面让我非常恼火,无法给塔勒布写以下信:

亲爱的塔莱布博士

我最近读了《黑天鹅》。像您一样,我也是Karl Popper的粉丝,而且我发现自己同意其中的很多内容。我认为您对荒谬谬论的解释基本上是正确的,并且引起了人们对一个现实和普遍问题的关注。但是,我认为第三部分的大部分内容会严重挫败您的整体论点,甚至可能使本书的其余部分失去信誉。真可惜,因为我认为有关“黑天鹅”和“未知未知数”的论点是基于其优点,而不依赖于第三部分中的某些错误。

我想指出的主要问题是-您对应用统计领域的表述不正确-并寻求您的答复,特别是如果我有被误解的问题。根据我的判断,第14、15和16章在很大程度上取决于一个稻草人的论点,歪曲了统计学和计量经济学。您所描述的计量经济学领域并不是我学习应用统计学,计量经济学和精算风险理论时所教的(在澳大利亚国立大学,但使用的是看起来很标准的文章)。您提出的问题(例如高斯分布的局限性)即使在大学阶段也能得到很好的理解和教导。

例如,您花了一些时间来说明收入分配如何不服从正态分布,并将其作为一般统计实践的论据来提出。没有胜任的统计学家会声称这样做,而且解决此问题的方法也已确立。例如,仅使用最基本的“第一年计量经济学”水平的技术,通过对变量进行对数转换就可以使您的数值示例更具说服力。实际上,这种转换会使您所说的大部分内容无效,因为原始变量的方差确实会随着其均值的增加而增加。

我敢肯定,有些不称职的计量经济学家会像您所说的那样使用未转换的响应变量进行OLS回归等,但这只会使他们变得不称职,并使用公认的不合适的技术。即使在大学本科课程上,他们也肯定会失败,因为大学课程花费大量时间寻找更合适的变量建模方法,例如收入,以反映实际观察到的(非高斯)分布。

广义线性模型族是一组技术,其开发目的是为了解决您提出的问题。许多指数分布族(例如Gamma,指数和泊松分布)都是不对称的,并且随着分布中心的增加,方差会增加,从而解决了使用高斯分布时所指出的问题。如果仍然太局限,则可以完全删除先前存在的“形状”,并简单地指定分布的均值与其方差之间的关系(例如,允许方差与均方的平方成比例地增加),使用“拟似然”方法进行估算。

当然,您可能会争辩说,这种形式的建模仍然过于简单化,并且存在一种智力陷阱,使我们无法思考未来将像过去一样。您可能是正确的,我认为您的书的优势在于使像我这样的人考虑到这一点。但是您需要与第14-16章中使用的参数不同的参数。例如,您对高斯分布的方差无论其均值是恒定的(这会导致可伸缩性出现问题)都是恒定的事实都是无效的。因此,您要强调一个事实,即现实生活中的分布往往是不对称的,而不是钟形曲线。

基本上,您对一种最基本的统计方法进行了过度简化(对具有高斯分布的原始变量进行过简单建模),并详细地(正确地)表明了这种过度简化的方法的缺点。然后,您可以使用它来缩小整个字段的范围。这要么是逻辑上的严重失误,要么是宣传技巧。不幸的是,因为它偏离了您的整体论点,我认为其中的大部分(如我所说)是有效和有说服力的。

我很想听听您的回应。我怀疑我是第一个提出这个问题的人。

此致

聚乙烯


24
您收到回应了吗?
主教

4
是。许多统计学家以前都批评过正态分布!仅举一个例子:著名的丹麦统计学家格奥尔格·拉施(Georg Rasch,以心理计量学中的拉希模型而闻名!)曾说,当他喝醉了很多之后,“所有提及正态分布的书籍都应该被烧毁”!
kjetil b halvorsen 2012年

5
++彼得。一个很好的信!
Michael Chernick 2012年

14
@cardinal-我收到了“由于全球金融危机以来我收到的电子邮件太多以致无法回复”的效果的自动回复。
彼得·埃利斯

4
看来,回应这本书的电子邮件数量本身就是BlackSwan。:)
gwr

22

我没有读过这本书,但是正如我所说,批评对我来说似乎是不合理的。如果极端事件很重要,则统计信息将在工具箱中提供适当的工具,例如极端价值理论,而好的统计学家将知道如何使用它们(或至少找到如何使用它们,并将充分从事于以下目的:进行分析)。批评似乎是“统计数字不好,因为有些统计数字不好,只知道正态分布”。


4
也许在批评它之前先读过这本书?
kjetil b halvorsen

7
@kjetilbhalvorsen我不是在批评这本书,我是在批评问题中提到的批评(这可能代表本书的内容,也可能不够)。我通过回答的措辞使其非常清楚(请注意,我只使用了“书”一词,以说明我没有读过它,也根本没有提到塔莱布)。也许在批评之前仔细阅读了答案?; o)
Dikran Marsupial

19

我认为说“书的重点是统计不是很有用”是不准确的。阅读本书后,他似乎要说的是定量金融或任何假设正态分布的证券交易之类的东西从根本上是有缺陷的(实际上,在书中,他称那些声称使用这些模型进行预测的人,“ charlatans”)。根据塔勒布(Taleb)的观点,虽然正态分布在建模有形/物理事物(例如身高,体重,寿命等)的价值方面做得很好,但是像市场这样的系统通常是由人类的情感驱动的,因此容易受到正态分布无法准确预测的大幅波动。

我对统计数据不太了解,在阅读此处的答案之前,我从未听说过极值理论之类的东西。无论如何,《黑天鹅》和《愚昧无知》似乎有相似的前提,即“正态分布并不总是可以的”。我不记得他对整个统计领域的诽谤。


16
(+1)第一句。然而,塔勒布比一个严肃的知识分子更像是一个(自我吸收的)论战主义者。我只有BS的第一版;他指出,他对统计的评论在许多地方都被夸大了而且没有得到任何消息,但是该文本的尝试论点比第一句中引用的要多。
红衣主教

3
+1我认为关键是在谈论金融时。我相信《纽约时报》中引用第一章的链接:nytimes.com/2007/04/22/books/chapters/0422-1st-tale.html
Wayne

6
例如,期权定价从对数收益的正常假设开始,但是现在知道很多人用更复杂的跳跃扩散/随机波动率模型来解释峰度。
muratoa 2012年

4
+1欢迎来到我们的网站!非常感谢您分享您的想法。
ub

4
阅读了本书并写了自己的评论(我可能会对亚马逊的评论家以及其他数千人进行评论),我认为Taleb将金融和股市作为他的主要例子,但他确实对此有更一般的看法。所谓的“黑天鹅”(Black Swans),他对统计数据和统计专业的看法非常不了解(至少在第一版中)。误用正态分布可以有效地批评某些人如何模拟罕见事件。但是,我们中的许多人都以正确的方式进行操作,采用正确的方法所获得的结果具有一定价值。
Michael Chernick 2012年

18

我确实读过《黑天鹅》,我很喜欢,而且我是统计学家。我完全没有发现它的“统计批评”是无法忍受的。逐点:

  1. 塔莱布没有发明黑天鹅的概念。相当长一段时间以来,它一直是哲学思想中的一个受人尊敬的例子!
  2. Taleb并不是批评“统计”,而是针对某些(不良)应用。
  3. 这本书是畅销书。它不是针对统计学家的,而是针对大众的。在教导公众关于统计学家的事情非常了解方面,这做得很好,但是其他许多读者(大多数!)却没有。因此,我们可以从该书中学到很多有关如何“出售”统计数据的知识。
  4. 对我而言,最重要的是,塔勒布(Taleb)引用了许多有关古希腊怀疑论哲学的文献。这里没有人提到这一点,但是我认为包容才是本书的真正卖点!
  5. 这本书是文学作品,而不是技术作品。如果您想批评Taleb的技术工作,请访问他的主页并下载他的一些技术论文。

对于那些不喜欢这个答案或不喜欢这本书的人,可以在新的https://fernandonogueiracosta.files.wordpress.com/2014/07/taleb-nassim-silent-risk中查看Taleb的技术论点。 PDF “沉默的风险”,这技术。


6
成为第一(哎呀—第二)受访者的大+1实际上有资格谈论这本书!(并且也说了一些有趣的话。)
whuber

4
根据高斯分布,他对计量经济学和统计学的表示又如何呢?
彼得·埃利斯

2
@kjetilbhalvorsen您说您读过这本书。如果您仔细阅读它,就不可能错过统计学专业的附件。拥有数学学位对个人的统计知识毫无意义。许多数学家没有参加单一的统计学课程就获得了认可。其他人可能只有一门非常基础的课程。我知道数学家教过统计学和/或概率,但实际上并没有资格这样做。
Michael Chernick 2012年

3
迈克尔·切尔尼克(Michael Chernik):可能会这样,但我仍然坚持批评作品的长处,至少不仅是它的短处!并且,文学作品必须照原样阅读。Taleb应该为将“黑天鹅”变成许多人所理解的概念而感到高兴。这是一个重要的概念。所有嘲笑拉姆斯菲尔德(Ramsfeldt)谈论“未知未知数”的记者都表明了这一点。拉姆斯费尔特只是在使用他从军官那里学到的概念!至少他们了解黑天鹅。
kjetil b halvorsen 2012年

9
如果塔勒布写的是一部小说,“文学作品”只是歪曲现实的借口。不进行技术处理是可以原谅的,对虚假陈述的误解较少。
Fomite

10

我还没有读过《黑天鹅》,但是如果他对统计学的批评确实如您所说的那样简单,那就太荒谬了。显然,某些统计信息依赖于正态分布,但很多情况并非如此。

可以对罕见事件进行建模吗?当然可以。真正的问题是如何对它们进行建模。根据我们对罕见事件及其先例的了解程度,该问题在不同领域将有不同的答案。

在今天的《纽约时报》杂志上,内特·西尔弗(Nate Silver)发表了一篇有趣的文章,内容涉及过去十年左右天气预报的改进情况。这包括对罕见事件(例如飓风)进行更好的建模。

这本书值得一读吗?


3
我读过这本书,并提出了类似的反驳,例如您和Dikran的反驳。塔莱布似乎很幼稚。几年前,他在JSM举行了一次会议。我认为是在华盛顿。第二版在那之后问世,并且更加合理。塔勒布(Taleb)对于某些“黑天鹅”有一些有趣的话要讲,他对经济学也很了解。我认为值得一读,第二版更好。
迈克尔·切尔尼克

您是统计网站的管理员,因此第3部分可能不会引起您的兴趣。它甚至可能会激怒您。第一部分和第二部分可能会给您一些统计之外的见解。您可以尝试阅读第一章左右的内容,然后从此处判断本书的其余部分。关于天气,塔莱布(Taleb)似乎暗示天气预报员是倾向于成为专家的专家:倾向于成为专家的专家:牲畜法官,天文学家,测试飞行员,土壤法官,国际象棋大师,物理学家,数学家(当他们处理数学问题时) ,而不是经验性的),会计师,谷物检查员,ph
BCLC

谷物检查员,照片解释员,保险分析师(处理钟形曲线式统计数据)。往往是……而不是专家的专家:股票经纪人,临床心理学家,精神病学家,大学招生人员,法院法官,议员,人员选择人员,情报分析人员(尽管花费了很多钱,但CIA的记录还是可怜的),除非有人考虑在内一些大剂量的隐形预防。我将通过自己对文献的考察来补充这些结果:经济学家,金融预测师,金融教授,政治学家,“风险专家
BCLC

”,“国际清算银行”工作人员,国际金融工程师协会的庄严会员和个人财务顾问。简单来说,移动的事物(因此需要知识)通常没有专家,而静止的事物似乎有一些专家。换句话说,处理未来并基于不可重复的过去进行研究的专业存在一个专家问题(天气和涉及短期物理过程而非社会经济过程的企业除外)。
BCLC

1
是的,这本书值得一读!
kjetil b halvorsen

8

我也没有读过这本书,但是他的观点不可能像说正态分布的尾巴更胖那样简单。这将是对其他答案的评论,但我在该网站上没有获得足够的赞誉。

从维基百科:

他说,统计从根本上说是不完整的,因为它无法预测罕见事件的风险……”

这个问题也非常类似于社区对第四象限的看法?


2
我不知道有关“第四象限”的帖子。约翰·库克(John Cook)指向塔勒布(Taleb)讲话的JSM,并提供了指向他在该讲话中博客评论的链接。该帖子简直是我的副本,但那里的讨论很短。因此,我认为值得继续进行这一工作。
迈克尔·切尔尼克

2
我认为统计数据无法预测罕见事件的风险是不正确的。这很困难,因为在数据中通常没有太多信息可用于估计集中趋势,因此对数据有用。因此,统计数据与数据无关紧要。
Dikran有袋动物2012年

2
@dikran:我同意你的观点,我认为他的书是巨魔书。但是,在与他的辩论中,我仍然会输得很惨,就像在有经验的智能设计辩论者中,我输给我一样。
草案

1
@草稿是的,有充分的理由使公众不再讨论科学思想!
迪克兰有袋博物馆,2012年

4
这本书不仅涉及统计问题,还涉及更多有关他的关于“未知未知数”(所谓的黑天鹅)和“荒谬谬误”(将世界当作具有权能概率的骰子游戏来对待)的论点。不依赖于他对统计的误导,因为它取决于正态分布。您可以删除所有统计信息章节并极大地改进本书。
彼得·埃利斯


5

我不认为Taleb实际上会说依赖于高斯分布的统计技术没有用。他在书中的观点是,它们对于许多(但不是全部)物理或生物过程和建模非常有用。他提出了一些好点和坏点(《黑天鹅》和《连环漫画》是“万物都是力量法则!”的祸根,今天仍然困扰着我们),但请务必记住,这本书是文学和哲学著作的集合专为外行人准备的论文。

话虽如此,我认为塔勒布喜欢使人恶化。您可以在他与迈伦·斯科尔斯(Myron Scholes)的战斗中看到这一点。在这种情况下,它可能对本科生水平的统计教育很有用,有时甚至是对研究生水平的统计教育,在假定高斯分布的情况下也很有用。我想在他从事金融业的那几年里,他遇到了很多具有Black-Scholes和其他技术知识的量化分析师,但他们没有考虑诸如分布之类的基本假设。我怀疑塔莱布(Taleb)未能接受适当的教育而在教育机构king之以鼻。


1
+1您的有趣评论。但是我不同意他对正态分布的看法。他似乎认为统计学家会在不适用的地方使用它,以这种方式来描述统计学家是非常错误的。他现在可能知道得更多。是的,他显然具有挑衅和激怒人的写作风格。
迈克尔·切尔尼克

1
我没有这本书,这是从记忆中来的。当然,他的某些愤怒来自与人的不良经历。他告诉我,“有人”(当我拿到书时会编辑,并能找到名字)对他大吼:“我是美国国家科学院的一员”!那不是一个确切的论点,使用它本身需要嘲笑“某人”。
kjetil b halvorsen 2012年

2
我可能对阅读的内容不知所措,但是我显然是NTT成员,举了几个例子说明了高斯分布的合理性,例如他的咖啡杯。我把书送走了,所以我不能回头再重新评估它。塔勒布的通俗著作比他的专业著作更具争议性,至少我对后者的阅读如此。
Fraijo 2012年

2
我认为我们不是在争论Taleb认为正态分布是没有道理的。只是对于他认为很重要的示例,他认为使用它是不适当的。他对此表示正确,但认为大多数统计学家确实在这种情况下使用了它是错误的。
迈克尔·切尔尼克

1
有趣的是,不仅有多少评论者没有读过这本书(我曾经略读过这本书,而且很多),还有很多人读过这本书,只是觉得不适合使它​​方便。“我给了它” “我把它留在阁楼上”;等
rolando2

2

你们那些还没有读过这本书的人根本不合时宜。他在可伸缩性和不可伸缩性之间做了很大的区分。对于不可扩展的事务,传统统计数据将足以满足需要。他一点也不批评。黑天鹅起源于可扩展性,很难根据过去的经验数据进行预测。这本书是关于这些事件如何产生巨大影响的,通常只在事后解释。认识论是极好的。


-2

不读这本书,我会感到高斯的钟声失败了,因为它们从来没有给出“概率密度”的明确定义。除此之外,他们从不给出洛伦兹曲线的完整点集,这些点同时包括分布变量的总数和感知前者的总体总数。如果使用“密度”,则必须说明什么变量。例如,如果您说的是千克/升,则是指与体积相关的重量密度。高斯理论在教科书中没有给出这一步骤。难怪年轻人对统计数字的理解不正确。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.