有没有关于统计或机器学习的好的科普书籍?


37

周围有一堆非常不错的通俗科学书籍,涉及真正的科学,以及历史和背后的理论背后的原因,同时仍然非常有趣。例如,詹姆斯·格里克(James Gleick)的“混沌”(混沌,分形,非线性),斯蒂芬·霍金(Stephen Hawking)的“时间简史”(物理学,宇宙起源,时间,黑洞)或理查德·道金斯(Richard Dawkins)的“自私基因”(进化和自然选择)。这些书中有些提出论据(道金斯),有些则没有论据(格里克)。但是,它们都使我们这些人无需进行深入的科学教育就可以轻松理解原本困难的概念。

是否有任何此类书籍主要关注统计学或机器学习?

请附上每本书的摘要。


我非常大胆地将ML添加到标题中,因为统计数据和ML都是该站点的两个顶级主题,否则,人们可能会很想提出关于ML的相同问题。我希望可以。
steffen

2
(+1)在阅读有关我知道的话题的书时,有时会令人发怒,这显然有助于获得外界看法,并希望有想法向外行人解释困难的概念。
steffen

@steffen:是的,我想知道是否应包括在内。坦白说,我目前对ML不感兴趣,但是我认为答案将包括与ML相关的书,因为从流行科学的角度来看,ML和统计信息基本上是同一回事。无论如何,我们很乐意将其包含在内,因为它可能会再增加几本书,并且不需要重复:)
naught101

@ naught101如何使其成为社区Wiki?
Momo 2012年

@Momo:对此感到高兴。我自己做不到。
naught101

Answers:


15

我怀疑David Salsberg创作的The Lady Tasting Tea正是您想要的。它以叙事风格写的,几乎就像一本小说,几乎没有数学(我记得),因此任何人都可以使用。我很早以前就读过,非常喜欢。它的阅读速度非常快,可以使人们了解统计分析的含义,以及它如何帮助我们理解世界并解决实际问题。


是的,叙述很重要。我打算将其包括在问题中,但是我使用的一些示例并没有出色的叙述(例如道金斯),我忘记了。
naught101 '11

2
刚读完此书,这正是我要的内容,因此感谢您的建议。我发现写作质量相当差,起初很让人分心,但过了一会儿我就习惯了。涵盖的材料非常出色,并且可以很好地说明统计数据的来源,推动人们进行发现的动因,并让您瞥见即将发生的事情,以及对获得令人兴奋的可能性的感觉更多地参与该领域。可能看看我是否可以得到一些讨厌统计的朋友来阅读它:)
naught101 2013年


7

Sharon Bertsch McGrayne撰写的“不会消亡的理论”是一本非常易读的书,讲述了贝叶斯统计的历史及其背后的一般思想,而又不会对数学产生太大的兴趣。

我还是Gonnick和Smith撰写的“卡通漫画指南”的忠实拥护者,通过一些数学知识很好地介绍了统计学的一般概念,但是以不会让您入睡的方式呈现(我也有有关遗传学,物理学和化学的卡通指南,并阅读了其他两本)。


6

更好的读物:

山姆·萨维奇的平均缺陷

纳西姆·塔勒布(Nassim Taleb)愚弄随机

这两本书都是关于如何谨慎地解释我们的日常生活中的概率和统计数据的警示书。例如,在金融市场中,人们可能会滥用日常的高斯分布作为具有灾难性后果的风险度量,因此我们可能希望在实践中使用更多基于经验的模型(例如蒙特卡洛模拟)。塔勒布(Taleb)在金融界非常受欢迎,经常提醒我们要谨慎对待行为偏见和对模型的过度依赖


6

我建议以下几本书,尽管都不是理想选择,但您应该检查一下:

  1. B.曼德尔布罗特(伟大的)B. 的市场行为
  2. Jefferey Rosenthal击中闪电

前者更多地侧重于金融,但仍处于固定状态,后者介绍了所有有趣的概率主题:赔率,蒙蒂·霍尔(Monty Hall)问题,效用函数,随机游走等。


5

一本非常好的书,可以帮助人们掌握基本的统计知识统计推理 ,并使它们具有重要意义,本书安德鲁·迪诺(Andrew Dilnot)撰写的《那只老虎不是老虎》,他是英国广播公司(BBC)热门广播节目的前主持人。

我经常将其推荐 Ben Goldacre 撰写的流行科学书籍Bad Science的统计数据。这对于引入基本的统计推理,显示基本的统计推理的重要性,并使人们担心真正应该更了解的人(尤其是政客,记者等)中缺乏基本的统计推理很有用。非常容易接近,引人入胜,在某些地方很有趣,而在其他地方则深感担忧!对于任何认为数字不是“他们的东西”的人来说,这都是非常好的介绍。


4

伊恩·艾尔斯(Ian Ayres)是《超级粉碎者:为什么数字思维是明智的新方法》一书的作者,该书讨论了数据挖掘的几个示例。


3

我想通过指出一些我已经阅读并强烈推荐的关于模糊集,信息论,熵和统计推理的优秀大众市场风格书籍来填补这一空白。

•对于所有模糊事物,一个很好的非正式起点是McNeill,Dan,1993,模糊逻辑。西蒙与舒斯特:纽约。

•有关围绕人脑组织的一些有趣推测,对神经网络的良好大众市场介绍,请参见Hawkins,Jeff,2004年,《智能》。时报:纽约。

有关易于理解的重要主题的介绍,例如统计数据的陷阱和谬论,请尝试以下三种方法:

•霍夫(Huff),达雷尔(Darrell),1954年,《如何撒谎与统计》。WW Norton&Company纽约。

•Kault,David,2003年,《常识统计》。格林伍德出版社:康涅狄格州韦斯特波特。

•史密斯(Smith),加里(Gary),2014年,标准偏差:有缺陷的假设,折磨的数据和其他撒谎的统计方法。忽视新闻:纽约。

以下与信息论和熵有关:

Lucky,RW,1989年,《硅梦:信息,人与机器》。圣马丁出版社:纽约。

•作者出色地将信息论放在了语境中并指出了它的滥用,同时仍以非专业人士可以理解的方式撰写:皮尔斯,约翰·罗宾逊,1961年,《符号,信号和噪声:自然与沟通过程。哈珀:纽约。

•我读过类似的标题,但记不清它是更高版本还是后续版本:Pierce,John Robinson,1980年,《信息论概论:符号,信号与噪声》。多佛出版物:纽约。

•如果我没记错的话,那么作者很容易阅读,同时仍然涉及一些更高级的概念:布里渊(Brillouin),莱昂(Léon),1964年,《科学,不确定性和信息》。学术出版社:纽约。

•另请参阅布里渊(Lrill),1962年,《科学与信息理论》。学术出版社:纽约。

•我很早以前就读过这篇文章,但是我相信他是可读性强的,并且对信息论有一些有趣的观察:Bar-Hillel,Yehoshua,1964年,《语言和信息:论其理论和应用》。Addison-Wesley Pub。公司,马萨诸塞州。

我要提醒大家,关于混乱,信息,量子物理学,概率,随机性,“控制论”,自组织,模糊集和人工智能等令人鼓舞的主题的大众市场书籍包含的内容很少,但很少方式失衡,有时甚至在逻辑上无效。这些理论中的每一个都有著名的拥护者,他们不知道什么时候停止做一件好事,并且做出巨大的逻辑飞跃,将他们的特定领域变成对一切事物的宏大解释。。每个人的作者都超出了证据,甚至忽略了其领域的创建者的明确警告,就像香农关于滥用信息熵的做法一样。他们的写作有一种狂热,不健康的色彩,有时可以说是曲柄产生的垃圾科学。我可以说出一些著名的名字,这些名字基于明显的逻辑谬误甚至有时是错误的事实,继续在这些主题上发表令人发指的东西。在这里我不会为了避免一场严重的火焰战争而这样做,因为我必须召唤一些偶像和圣牛。请注意,此类误导性材料已经存在,并准备对其进行红色标记。在没有必要的非凡证明的情况下提防非凡索赔。


1

伦纳德·姆洛迪诺(Leonard Mlodinow)的《醉汉步道》(Drunkard's Walk)是一本简单易懂的基本数据和概率介绍。内容针对的是未经统计或数学培训,没有方程式的受众。我发现它有些笨拙。有许多与不良统计数据的各种应用有关的轶事,并清楚地解释了为什么它们是错误的。

本书涵盖了基本统计数据和条件概率。


1

Kaiser Fung的《数字统治您的世界》描述了统计数据在许多现代社会基本系统中的重要性,例如保险市场。

同样是冯德iser(Kaiser Fung)的《数字意识》Number Sense)更具体地谈论“大数据”。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.