Answers:
坦率地说,我不认为大数定律在工业中起着巨大的作用。理解通用过程的渐近合理性,例如最大似然估计和检验(尤其是无所不包的GLM和logistic回归),引导程序,但这是分布问题,而不是遇到不良样本问题的可能性。
除了已经提到的主题(GLM,推理,引导程序)之外,最常见的统计模型是线性回归,因此必须对线性模型有透彻的了解。您可能永远不会在行业中运行ANOVA,但是如果您不了解ANOVA,就不应称其为统计学家。
有不同种类的产业。在制药业,没有随机试验和逻辑回归就无法谋生。在调查统计数据中,没有Horvitz-Thompson估计量和不答复调整项就无法谋生。在与计算机科学相关的统计中,没有统计学习和数据挖掘就无法谋生。在公共政策智囊团(以及越来越多的教育统计数据)中,如果没有因果关系和治疗效果评估器(越来越多地涉及随机试验),您就无法谋生。在市场研究中,您需要将经济学背景与心理计量学理论相结合(并且在典型的统计部门产品中您都不会学到这两种方法)。工业统计数据采用自己独特的六个西格玛范式,但与主流统计数据之间却遥不可及。在实验材料的设计中可以找到更强的结合力。华尔街的材料将一直是金融计量经济学,一直到随机演算。这些是非常不同的技能,与“学术性”相比,“行业”一词的定义甚至更差。我认为没有人可以声称同时了解以上两个或三个以上内容。
但是,“行业”(无论对您而言意味着什么)普遍要求的最高技能是时间管理,项目管理以及与统计上不太精通的客户的沟通。因此,如果您想为进入行业做好准备,请在商学院就这些主题上课。
更新:原始帖子撰写于2012年2月;这些天(2014年3月),您可能应该称自己为“数据科学家”,而不是“统计学家”,以找到行业中的热门工作……并更好地学习一些Hadoop,以进行自我宣传。
我不会说这与诸如大数定律或中心极限定理之类的东西非常相似,但是由于对因果关系进行推论通常是中心的,因此人们应该熟悉理解Judea Pearl关于使用结构图建模因果关系的工作用。它提供了一种方法,以了解为何实验和观察研究在因果推理方面存在差异,并提供了处理观察数据的方法。为了获得良好的概览,他的书在这里。
随便的推断是必须的。以及如何解决它的根本问题,您不能及时回去,也不能给别人治疗。阅读有关鲁宾的文章,费舍尔(Fisher)是现代统计学的学生的创始人。)....要学习如何解决该问题,适当的随机化以及大数定律如何正确地对事物进行随机化,假设检验,可能的结果(反对异质假设)并且非常适合缺失),匹配(对于缺失来说是很好的选择,但潜在结果更好,因为它更笼统,我的意思是为什么当您只能学习一个复杂的东西时,要学习很多复杂的东西),Bootstrap,当然是贝叶斯统计(贝叶斯回归) ,朴素的贝叶斯回归,贝叶斯因子)和非罗马式替代。
通常在实践中,请遵循以下一般步骤,
关于先前的评论,您通常应该首先从ANOVA(随机效应或固定效应,并将连续类型转换为垃圾箱)开始,然后使用回归(如果进行转换和更改,有时可能与ANOVA一样好,但决不能击败它)要查看哪些特定治疗有效,(使用多重t检验并使用像Holm methid这样的校正方法)使用回归。
在必须预测事物的情况下,请使用Bayasian回归。
超过5%的失踪会使用潜在结果
数据分析的另一个分支是有监督的机器学习,必须提到