我刚刚观看了有关统计推断(“比较比例和均值”)的讲座,这是统计在线课程简介的一部分。对于我来说,这种材料一如既往地毫无意义(到现在为止,我必须已经看过数十遍这种材料,并且在过去的三十年中一直散布着)。
我正在寻找一本有关“基本Stats-101”的书(分数估算,估算评估,统计推断,假设检验,研究设计),该书认真对待了说服怀疑论者的问题。
下面,我给出了一些我正在寻找的作者会认真对待并知道如何令人信服地解决的问题类型的示例。
但是首先让我花点时间强调一下,在这篇文章中我没有问这些问题。 请不要回答他们! 我以“石蕊试纸法”(针对搜索作者的类型)为例进行举例说明。
如果“比例”只是布尔变量的均值(即仅取值0和1的布尔变量),那么为什么要教不同的过程来对“比例”和“均值”进行统计推断呢?
如果正态分布非常健壮,即使在数据不是非常正态分布的情况下,假设正态性也会产生良好的结果,并且如果t分布看起来很正态,那么为什么所有关于使用t分布而不是正常?
“自由度” 到底是什么?为什么我们担心它们?
考虑到我们只是使用恰好看起来与数据相似的分布,说一个参数的“真实”值意味着什么?
为什么“探索性数据分析”是一件好事,而“数据监听”却是一件坏事?
正如我已经说过的,我对忽略此类问题所隐含的态度感到不满意。我不想在教给我一些东西的人中看到“认识论立场”。我正在寻找尊重读者的怀疑和理性,并且知道如何解决这些问题的作者(不必深入探讨形式主义和技术性的页面)。
我意识到这是一个艰巨的任务,尤其是在统计方面。因此,我不希望有很多作者能够成功。但是现在我只满足于找到一个。
让我补充一点,我不是数学上的厌恶者。相反,我喜欢数学。(我对分析(又称“高级演算”),线性代数,概率论,甚至基本测度论感到满意。)
也就是说,我目前的兴趣是“应用”,“实用”,“日常”,“现实”统计(与理论上的细微差别相反)。(但我也不想要食谱!)
FWIW,我已经阅读了Gelman和Hill的使用回归和多层次/层次模型进行数据分析的前几章,并且我喜欢作者的语气。他们的重点是实际的,但在需要时可以进行理论探讨。他们还经常退后一步,对标准做法进行严格评估,并提出坦率的见解,以引起怀疑的读者的常识。不幸的是,这些作者还没有写一本书专门讨论我在这篇文章中要问的话题(如上所述,“ Stats 101”一词)。我还知道,其中一位作者(Gelman)与人共同撰写了备受赞誉的贝叶斯数据分析,但是,这又不是我目前正在寻找的东西。
编辑:
Dikran Marsupial提出以下反对意见:
我认为忽略问题并不一定有什么不对,有一个观点认为,解决每个问题有损于通常更重要的基本概念的阐述(尤其是在统计101本书中!)。
我同意这一点。如果我说我正在寻找“第二眼基本统计数据”,那对我来说会更准确。实际上,以此为动力,我看了研究生课程中有关推理(说)的教科书,发现它们太像我列出的问题而被忽略了。如果有的话,他们似乎甚至不太愿意去研究这样的问题(这样他们就可以专注于诸如某些融合条件或其他……)的问题。
问题在于,更高级的书籍针对的是完全不同的读者群体,其中“局外人”的怀疑已被彻底耗尽。IOW,那些正在做研究生水平统计的人已经超出了困扰我的问题的地步。他们不再对这些东西持怀疑态度。(他们是如何克服怀疑态度的?然后统计一下。其他人可能有老师填写了他们的课本不足的地方。一些人可能很聪明,可以自己找出这些问题的答案。