怀疑(但不反对数学)读者的推理


14

我刚刚观看了有关统计推断(“比较比例和均值”)的讲座,这是统计在线课程简介的一部分。对于我来说,这种材料一如既往地毫无意义(到现在为止,我必须已经看过数十遍这种材料,并且在过去的三十年中一直散布着)。

我正在寻找一本有关“基本Stats-101”的书(分数估算,估算评估,统计推断,假设检验,研究设计),该书认真对待了说服怀疑论者的问题。

下面,我给出了一些我正在寻找的作者会认真对待并知道如何令人信服地解决的问题类型的示例。

但是首先让我花点时间强调一下,在这篇文章中我没有问这些问题。 请不要回答他们! 我以“石蕊试纸法”(针对搜索作者的类型)为例进行举例说明。

  1. 如果“比例”只是布尔变量的均值(即仅取值0和1的布尔变量),那么为什么要教不同的过程来对“比例”和“均值”进行统计推断呢?

  2. 如果正态分布非常健壮,即使在数据不是非常正态分布的情况下,假设正态性也会产生良好的结果,并且如果t分布看起来很正态,那么为什么所有关于使用t分布而不是正常?

  3. “自由度” 到底是什么?为什么我们担心它们?

  4. 考虑到我们只是使用恰好看起来与数据相似的分布,说一个参数的“真实”值意味着什么?

  5. 为什么“探索性数据分析”是一件好事,而“数据监听”却是一件坏事?

正如我已经说过的,我对忽略此类问题所隐含的态度感到不满意。我不想在教给我一些东西的人中看到“认识论立场”。我正在寻找尊重读者的怀疑和理性,并且知道如何解决这些问题的作者(不必深入探讨形式主义和技术性的页面)。

我意识到这是一个艰巨的任务,尤其是在统计方面。因此,我不希望有很多作者能够成功。但是现在我只满足于找到一个

让我补充一点,我不是数学上的厌恶者。相反,我喜欢数学。(我对分析(又称“高级演算”),线性代数,概率论,甚至基本测度论感到满意。)

也就是说,我目前的兴趣是“应用”,“实用”,“日常”,“现实”统计(与理论上的细微差别相反)。(但我也不想要食谱!)

FWIW,我已经阅读了Gelman和Hill的使用回归和多层次/层次模型进行数据分析的前几章,并且我喜欢作者的语气。他们的重点是实际的,但在需要时可以进行理论探讨。他们还经常退后一步,对标准做法进行严格评估,并提出坦率的见解,以引起怀疑的读者的常识。不幸的是,这些作者还没有写一本书专门讨论我在这篇文章中要问的话题(如上所述,“ Stats 101”一词)。我还知道,其中一位作者(Gelman)与人共同撰写了备受赞誉的贝叶斯数据分析,但是,这又不是我目前正在寻找的东西。

编辑:

Dikran Marsupial提出以下反对意见:

我认为忽略问题并不一定有什么不对,有一个观点认为,解决每个问题有损于通常更重要的基本概念的阐述(尤其是在统计101本书中!)。

我同意这一点。如果我说我正在寻找“第二眼基本统计数据”,那对我来说会更准确。实际上,以此为动力,我看了研究生课程中有关推理(说)的教科书,发现它们像我列出的问题而被忽略了。如果有的话,他们似乎甚至不太愿意去研究这样的问题(这样他们就可以专注于诸如某些融合条件或其他……)的问题。

问题在于,更高级的书籍针对的是完全不同的读者群体,其中“局外人”的怀疑已被彻底耗尽。IOW,那些正在做研究生水平统计的人已经超出了困扰我的问题的地步。他们不再对这些东西持怀疑态度。(他们是如何克服怀疑态度的?然后统计一下。其他人可能有老师填写了他们的课本不足的地方。一些人可能很聪明,可以自己找出这些问题的答案。


2
这些问题中的大多数-我们不愿回答的问题-在简历上已经有很好的答案。其中一些问题甚至给出了相当简单的答案。但是有一个问题,一千任何话题时人们想出了-你永远不会找到,涵盖所有可能出现的问题,也不会找到一个刚预计只是具体的问题,这说明有当你看或阅读。好吧,您可能会偶然碰到一两个,但总的来说,这是不可能的标准。为什么不问这些问题呢?在回答问题的网站上?
Glen_b-恢复莫妮卡

2
我会说,当人们进行统计时也会出现类似的问题(有些书回答了其中的一些问题),但是大多数不是与怀疑论有关的实际问题-大多数是简单的理解性问题。例如,“什么是自由度以及我们为什么要关心”一点都不怀疑,它要求澄清解释和动机。高级统计人员之所以不担心的原因是,因为他们已经了解了自己如此有价值的原因。
Glen_b-恢复莫妮卡

Answers:


6

您已经有了一些好的建议。这里还有更多。首先,我偶尔会阅读两个博客,有时还会讨论您问自己这样的问题。由于它们是博客,因此您甚至可以提出问题并获得一些很好的答案!他们来了:

http://andrewgelman.com/(Andrew Gelman)

http://errorstatistics.com/(Deborah Mayo)

我认为有几本书对您有帮助:Box,Hunter和Hunter:实验者的统计资料。

就像标题所说的那样,对于那些想要设计自己的实验并对其进行分析的人们来说,这是一门(“第一”,但实际上是……第二)课程。“为什么”部分非常高。

然后:DR Cox:《统计推断原理》,另一本非常好的书,讲述了“为什么”而不是“如何”。

而且,由于您问为什么均值和比例会被不同对待,因此这本书没有做到这一点:http : //www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = books&ie = UTF8&qid = 1373395118&sr = 1-1&keywords = freedman + statistics

数学低,原则高。


8

我相当怀疑是否会有一本书适合您,因为个人倾向于对不同的事物持怀疑态度,并且书籍是为目标受众而非个人编写的。这是一个人教书的好处之一,而不仅仅是一本书,这是您可以随时问问题。在线性文本中,这是一件非常困难的事情。

我认为忽略问题并不一定有什么不对,有一个观点认为,解决每个问题有损于通常更重要的基本概念的阐述(尤其是在统计101本书中!)。

我怀疑最好的方法是获得一本好书,然后在其他地方查找未解决问题的答案。我眼前有一个充满统计数据的书架,这仅仅是因为没有一个孤立的统计数据足以满足我的需求(甚至连Jaynes的书都没有; o)。

对于绝对的初学者,我认为Grant Foster的书“ Understanding Statistics”是一个很好的起点,但是我怀疑在这种情况下,它太基础了。


1
“我认为忽略问题不一定有什么问题……”我认为这是一个公平的反对;我在帖子中添加了EDIT来解决。
kjo 2013年

7

XΘXΘΘXtXΘ


5
+1统计程序出现可疑之处的很大一部分原因是因为它们相当违反直觉,而且对统计如何以这种方式结束的历史评价对于怀疑论者来说可能是个好方法。
迪克兰有袋博物馆,

2
@DikranMarsupial:事实上,我读过斯蒂格勒的《统计历史》,正是为了弄清我在统计方面遇到的困难。它确实帮助了一些人。不幸的是,在费舍尔与内曼时代(我怀疑)出现了许多反常的怪异现象时,大部分时间都没有了。我尝试了约50页Hald的书,但发现他的推导不可能遵循:它们显然是针对具有统计学专业知识的读者的。统计数据如此怪异吗?” 会卖得好... :)
kjo

4
恕我直言,统计的反直觉性早于费舍尔与内曼时代(尽管直觉并不意味着有用,反之亦然)。伊恩·哈金(Ian Hacking)的书可能值得一试,我很喜欢“概率的出现”。我发现贝叶斯统计在概念上比常客统计更容易理解,但在实践中却很难执行。理解贝叶斯方法与常客方法之间的差异对我理解常客方法有很大帮助。
Dikran有袋动物

1
谢谢,我将检查Hacking。他的书在我眼中已经存在了很长时间,尽管我推迟阅读他的书,认为他更专注于概率论的哲学(我发现这一主题本身很有趣)。就是说,我认识到我至少有一些统计方面的问题会影响概率的解释,因此也许阅读Hacking会解决我的至少一些反对意见。
2013年

2
@kjo我读了Hacking的《统计推断逻辑》,发现它很“哲学性”-他赞成将可能性作为“支持”,而对Neyman-Pearson 持反对态度,但坚持简单的例子-没有讨论令人讨厌的参数,多参数推论或任何棘手的问题(除非我忘记了)。当然,值得一读,但我不建议您从头开始。
Scortchi-恢复莫妮卡

6

阿贝尔森(Abelson,1995年)的《统计学作为原则的论点》是入门课程,对一些经常使学习者感到困惑的问题有一个有趣的看法。

但是也许您只需要阅读一些有关理论统计的书(跳过有关收敛,度量空间等的所有知识),然后即使它们没有像您的示例那样回答具体问题,您也可以回答其中的大部分问题他们自己,并按照@Dikran的建议查找其余部分。

我在另一篇文章中建议与Cox和Hinkley一起,“ 理论统计或Cox,统计推断原理”,以及Casella和Berger,统计推断》,以了解其中的不同观点。


1
我发现它很有趣,但我认为它根本没有达到OP期望的水平。
晚会

@Gael您可能是正确的,尤其是考虑到编辑。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.