从统计理论和应用中了解


13

我最近获得了医学和生物学建模硕士学位,并以工程数学为背景。尽管我的教育计划包括大量的数学统计学课程(请参见下面的列表),而且我都取得了很高的成绩,但我经常最终完全迷失了对统计学的理论和应用的迷恋。我不得不说,与“纯粹的”数学相比,统计学对我而言确实没有什么意义。尤其是大多数统计学家(包括我以前的讲师)使用的符号和语言令人费解,并且到目前为止,我所见过的几乎所有资源(包括维基百科)都没有简单的例子可以轻松地与给定的理论联系起来并与之联系在一起。 ..

这是背景;我也意识到,如果没有牢牢掌握统计数据,尤其是在生物信息学领域,我就无法从事研究人员/工程师的工作,这真是令人痛苦的现实。

我希望可以从经验丰富的统计学家/数学家那里获得一些提示。如何克服上面提到的这个问题?你知道任何好的资源吗?例如书籍,电子书,公开课程(例如,通过iTunes或OpenCourseware)。

编辑:正如我提到的那样,我对统计的一般标题下的大多数文献都持偏颇(消极)的态度,并且由于我无法在每个统计分支购买大量(昂贵的)教科书,因此我需要就一本书而言,它与Tipler&Mosca 的物理学相似,但与统计学无关

对于那些不了解Tipler的人;它是一本大型教科书,涵盖了人们在高等教育中可能遇到的绝大多数主题,并从基础入门到更详细地介绍了它们。基本上是一本完美的参考书,在我读大学的第一年就买了,仍然偶尔使用。


我参加过的统计课程:

  • 大型的入门课程
  • 平稳的随机过程
  • 马尔可夫过程
  • 蒙特卡洛方法
  • 生存分析

Answers:


4

我完全可以理解你的情况。即使我是博士生,我有时也很难理解相关的理论和应用。如果您愿意沉浸于对理论的理解,那么当您考虑现实世界中的问题时,这无疑是有益的。但是这个过程可能令人沮丧。

我喜欢的众多参考文献之一是Gelman和Hill的使用分层/多级模型数据分析。他们避开了可以通过仿真表达基本概念的理论。毫无疑问,这将使您受益匪浅,因为您拥有MCMC等方面的经验。正如您所说的,您从事生物信息学工作,也许Harrell的回归建模策略也是一个很好的参考。

我将其作为社区Wiki,让其他人添加到它。


感谢您对此事的关注。很高兴看到我不是唯一对这件事感到困惑的人。话虽这么说,我认为您高估了我的处境;我参加了许多课程,并且熟悉多种统计分析方法的存在;他们从不坚持我的课程。考试几个月后,我一直在想自己。“我已经在某处看到/听到过这个声音,但是它实际上是如何工作的呢?” 这对我来说意味着我需要将其全部拆散,并开始以更牢固的基础进行构建。
posdef 2011年

我会为Harrell的(注释拼写)文字添加一个响亮的“同意”字样。这是非常好的,因为它附带R代码的两个包装。我也认为Venables和Ripley的“带有S的现代应用统计”将是一个很好的收购。在使用MASS来学习R之前,我具有硕士学位的背景(具有物理学本科学位)。该书中有大量的应用智慧。
DWin

盖尔曼回归书很棒,他很好地解释了这一切,并提供了R代码,这对检查您对材料的理解很有用。
richiemorrisroe 2011年

2

您是否熟悉贝叶斯数据分析(由Gelman,Carlin,Stern和Rubin撰写)?也许这就是您需要的剂量。


2

所有统计问题基本上都可以归结为以下4个步骤(我是从@whuber的另一个问题中借来的):

  1. 估计参数。

  2. 评估该估计的质量。

  3. 探索数据。

  4. 评估适合度。

您可以与单词模型交换单词参数

统计书通常会针对各种情况提供前两点。每个现实世界中的应用程序都需要不同的方法,因此需要使用不同的模型,因此,大部分书籍最终将这些不同的模型归类。这具有不想要的效果,即容易使自己迷失在细节中而错过全局。

我衷心推荐的大图画书是渐近统计。它对该主题进行了严格的处理,并且在数学上是“纯净的”。尽管其标题提到了渐近统计,但最大的秘密却是,大多数经典统计方法本质上都是基于渐近结果的。


2

我认为,这里最重要的是要对统计和一些常规统计概念形成直觉。也许最好的方法是拥有一个您可以“拥有”的域。这可以提供一个积极的反馈循环,其中对领域的了解可以帮助您更多地了解基础统计信息,从而可以帮助您对有关领域的更多了解,等等。

对我来说,领域就是棒球统计数据。我知道在游戏中连击3比4的击球手并不是“真正的” .750击球手。这有助于了解更普遍的观点,即样本数据与基础分布不同。我也知道他可能比.750的命中者更接近普通玩家,因此这有助于理解诸如回归均值的概念。从那里我可以得到成熟的贝叶斯推断,其中我的先验概率分布是平均棒球运动员的均值,现在我有4个新样本可用来更新我的后验分布。

我不知道该领域对您有什么帮助,但是我想它比单纯的教科书更有帮助。实例有助于理解理论,有助于理解实例。一本带有示例的教科书很好,但是除非您可以使这些示例成为“您的”,否则我想知道您是否将从中得到足够的收益。


1

从我的角度来看,作为回归建模策略的替代方法,对于更实际的方法,应用线性统计模型非常好。


1

每个人的学习方法都不同,但是我可以肯定地说,例子,例子,例子对统计有很大帮助。我的建议是学习R(仅仅是基础知识就可以提供很多帮助),然后您可以尝试任何一个示例,直到眼睛流血为止。您可以对其进行排序,拟合,绘制,命名。而且,由于R是面向统计的,因此当您学习R时,您将在学习统计。然后,可以从“向我展示”的角度来攻击您列出的那些书。

由于R是免费的,并且许多原始资料是免费的,因此您需要投入的只是时间。

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

您可以购买很多有关R的好书,这是我使用过的书:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

编辑============

我忘了添加几个链接。如果您使用Windows,Tinn-R是一个很好的R编辑器(其他人可以在Mac或Linux上为编辑器添加链接)。

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


感谢您提供的链接,我将在未来几周内尽可能多地尝试它们。...之前我在生存分析过程中接触过R,在该过程中我们做了很多多元回归(cox和aelen型号)和许多其他我真的不记得的东西。我对R的印象非常消极,因为他非常习惯于MATLAB,但是我做到这一点与以下事实有关:我们或多或少地被投入了池的深层,然后期望学习我们自己游泳,这当然使我从那时起就讨厌该软件:)也许应该改变一下
posdef 2011年

1

我个人很喜欢这种方法,它很好地融合了理论和应用程序(有很多示例)。这是与Casella和Berger更好地匹配的,它采用了更加面向理论的方法。并对此进行了广泛的概述。


这两本书似乎都对亚马逊有很好的评价,任何人都可以对此发表任何意见(也许更详细)吗?顺便说一句 Casella&Berger的意思是“统计推断”吗?
posdef'2

是的“统计推断”。对我来说,迈出了一大步,从了解概率模型到了解如何使用数据来测试模型和估计模型参数。特别是戴维森的书确实着眼于这一点。
alwaysean 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.