我的理解是,描述性统计定量地描述了数据样本的特征,而推论统计则推断出抽取样本的总体。
在大多数情况下,统计推断使用有关人群的命题,这些数据是通过某种形式的随机抽样从感兴趣人群中得出的。
“大部分”让我觉得我可能没有正确理解这些概念。是否有一些推论统计的例子没有对总体提出建议?
我的理解是,描述性统计定量地描述了数据样本的特征,而推论统计则推断出抽取样本的总体。
在大多数情况下,统计推断使用有关人群的命题,这些数据是通过某种形式的随机抽样从感兴趣人群中得出的。
“大部分”让我觉得我可能没有正确理解这些概念。是否有一些推论统计的例子没有对总体提出建议?
Answers:
来自行为科学背景,我将此术语特别与入门级统计教科书联系在一起。在这种情况下,区别在于:
重要的一点是,任何统计数据(推断性或描述性)都是样本数据的函数。参数是总体的函数,其中术语“总体”与所说的基础数据生成过程相同。
从这个角度来看,数据的给定功能作为描述性或推断性统计信息的状态取决于您使用数据的目的。
也就是说,某些统计数据显然在描述数据的相关特征方面更为有用,而某些统计数据非常适合于辅助推理。
因此,从这个角度来看,需要理解的重要事项是:
因此,您可以根据研究人员使用统计信息的意图来定义描述性和推论之间的区别,也可以根据统计信息的通常使用方式来定义统计信息。
一种推论形式是基于实验方法的随机分配,而不是基于总体的抽样(甚至假设)。奥斯卡·肯普霍恩(Oscar Kempthorne)是支持者。
预测是您不一定要制定有关人口的命题的另一个领域。(我不知道每个人都想将预测称为“推理”,但是有Geisser(1993),《预测推理:简介》)。预测通常是根据拟合的人口模型得出的,但并非总是如此。例如@Matt的分类示例,模型平均(贝叶斯或基于Akaike权重)或预测算法(例如指数平滑)。
注意:我认为“推论性统计与描述性统计”更多地是指学科统计学,而不是根据样本计算得出的数量。推论和描述性统计之间没有本质区别。正如@Jeremy指出的,这与您要使用的用途有关。
我不确定分类是否一定会说明从中提取数据点的总体。您可能知道,分类使用由一些“特征”向量组成的训练数据来预测属于其他未标记特征向量的类别标签,其中每个“特征”向量都标有特定类别。例如,我们可能使用患者的生命体征和医生的诊断来预测其他患者的健康或疾病。
一些分类器称为“生成分类器”,它们试图显式地对产生每个类的总体或数据生成过程进行建模。例如,朴素贝叶斯算法会计算 每堂课 ,假设所有功能都是独立的。这些模型可以合理地视为关于人口的陈述。
但是,其他分类器则在不对类本身建模的情况下寻找类之间的差异。这些称为判别式分类器。一个经典的例子是最近邻居分类器,该分类器将一个未标记的示例分配给它最近邻居的类(其中以某种明智的方式定义了close来解决问题)。这似乎并不包含很多(如果有的话)有关从中提取数据点的总体的信息。
如果您对描述性统计和推理性统计之间的差异感兴趣,那么考虑分析的目的可能会更有成果。描述性统计数据(例如均值)可能会告诉您典型湖中有多少鳟鱼-它们描述了某些东西。推论统计,例如-test,可能会告诉您在这些湖泊中鳟鱼的数量通常是否比鲈鱼多-它使您可以对描述性统计数据进行声明。
简而言之
描述统计是对数据的分析,这些数据以有意义的方式描述,显示或汇总数据;它只是描述我们有关整个人群的数据/谈话的一种方式。其中一些是集中趋势的度量和分散的度量
推论统计是一种技术,它使我们能够使用样本对抽取样本的总体进行概括。