如何用一句话描述统计?


27

当我第一次开始学习统计学时,诸如t检验,ANOVA,卡方和线性回归之类的程序似乎都是截然不同的生物。但是现在我意识到这些过程或多或少都在做同一件事。同样,诸如方差,残差,标准误差和均值之类的值也或多或少地衡量了同一件事。

因此,我认为所有这些过程和值以及实际上所有的统计信息都可以用一个简单的句子来描述:

期望值是多少,该值附近有什么变化?

期望这个词可以用以下任何一个词代替:假设的,预测的或中心的。

其他人如何用一句话描述统计数据?


10
@Trynna这说明过于狭窄:它不仅刻画点估计。这就像将数学描述为相加和相乘一样-这很可能是一个在学校里学习算术几年的人的观点-但与该领域的内容相去甚远。
ub

Answers:


26

统计数据提供了产生和理解数据的理由和方法。

美国统计协会


+1我试图提出一种非常接近此概念的表达。我已经添加了一些有关根据数据得出结论的内容,但这并不是那么简洁。
Glen_b-恢复莫妮卡2015年

3
@Glen您可以告诉我们,此表征过程已引起很多思考。我喜欢在我们网站的某个位置放置它。那个,以及对机器学习的类似精妙的描述,应该属于我们的帮助页面。
ub

2
我不确定我是否同意这句话(尽管这是一个可爱的愿望)。作为一名流行病学家,我知道我对研究设计,数据的产生以及围绕因果推理的因果推理有所了解,这超出了我周围许多优秀统计学家的能力。的确,递归因果图的奇特因果推论起源于三个领域,即统计学(流行病学,计算机科学和社会学,据我所知)。在一个好战的精神,不加这个,但是因为引用的句子描述了很多的科学,并且不会指甲挫统计本身
亚历克西斯(Alexis)2015年

3
ASA的描述更多地是关于统计,它是人类知识和活动的领域,而不是指出谁可能是“统计学家”。直到第二次世界大战之前,专业的统计学家还是很少见,但这并不意味着统计学就没有在商业和学术环境中得到应用。我认为对统计学的正确定义不会局限于专业统计学家所做的事情。
银鱼

1
@Alexis也许“理解”一词所隐含的理解水平有些困难,ASA的定义简洁明了。更广泛的解释可能过于笼统。当然,如果我们将实质性​​的身体或社会解释以及潜在的机制作为“理解”的一部分,那么它就超出了“纯粹的”统计范围。另一方面,我不清楚为什么从数据(无论是因果关系还是其他原因)进行的推断不能同时位于科学和统计工作的范畴之内。
银鱼

13

统计从根本上讲就是对数据结构的理解。

Bill Venables和Brian Ripley,《现代应用统计学》第1章的第一句话,带S


1
这是一个有趣的统计数据,尽管数量有限。可能的歧义正在揭示:计算机科学家将以非统计的方式理解“数据的结构”。(Venables和Ripley在统计和计算的交叉点工作。)
麻烦

@whuber我同意你的看法。没有任何迹象表明V&R打算将其作为所有统计信息的单句描述,但是自从我第一次阅读它以来,我一直认为它是一个很好的描述。我将“数据结构”解释为“样本来源人群的特征”。
mark999



5

就个人而言,我喜欢斯蒂芬·森(Stephen Senn)在《死亡切丁》中的以下引用机会,风险与健康(剑桥大学出版社,2003年)。我相信我要强调一句话(或两句话),以总结他的要点,尽管整个段落值得一读。

统计是,统计是。
与普遍的看法相反,单一的统计数字并不是真正的事实。这是关于我们如何知道,怀疑或相信某事是事实。因为了解事物涉及对事物进行计数和度量,所以,确实,统计复数是统计单数关注的一部分,这是定量推理的科学。该科学与哲学(特别是认识论)的共同之处要比会计重要得多。统计学家是应用哲学家。哲学家争辩说,有多少天使可以在一根针上跳舞?统计人员它们进行计数。或者说,指望有多少能大概跳舞。如果可以相信量子物理学家,那么概率就是问题的核心,也是一切问题的核心。就统计学家而言,这是正确的,无论世界是像爱因斯坦所信奉的那样是严格确定性的,还是存在不可避免的剩余不确定性。我们无法肯定地预测任何事情,但是平均而言,我们可以预测我们的预测将有多不确定。统计学是一门告诉我们如何做的科学。


5

统计学是从数据中学习并测量,控制和传达不确定性的科学。

玛丽·戴维迪安(Marie Davidian)和托马斯·路易斯(Thomas Louis)

他们继续:

; 从而为控制科学和社会进步的进程提供了必不可少的导航


我喜欢这个定义,因为它可以指出“不确定性”方面。第二部分很不错,因为它说统计数据不仅本身不存在,而且必须在更广泛的范围内查看。但是,要完全满意,我可能会将其与ASA合并到:
Momo 2015年

1
统计学作为一种从数据中学习以及测量,控制和传达不确定性的科学,为产生和理解数据提供了推理和方法。
Momo'3

2

统计学是一整套方法和思维方式,可以帮助人们从嘈杂的信息中得出清晰的结论。


2

因为我们不是一个无所不知的神灵,所以我们必须应对不确定性,而统计学提供了合并和反映不确定性的方法。


2

统计是哲学的一个子领域,它使用严格的数学概念来处理以下问题“我们如何从观察中学习”。

只是一个旁注,您可以将“一个句子”设置得很长,B。Hrabal写了一本书,其中包括一个长句子,请参阅: 老年舞蹈课程



2

统计是一套逻辑原理和数学方法,用于以准确,相关的方式汇总量化的信息。


1

用我自己的话

Statistics is the science of what might be

这有点嘲讽


1
如果您要掩盖第一个单词并要求人们填补空白,我怀疑“统计”不是他们想到的第一件事,也许也不是第二个或第三个。“未来学”,“猜测”,“科幻小说”,也许-更接近您的意图-“预测”和“预测”-将是受欢迎的选择。甚至“病原学”和“传神疗法”都是可能的。:-)
whuber

1

费舍尔(1922)在下面的引言中给出了他对统计本质的看法(我为一句话要求加了粗体):

为了得出统计问题的独特表述,有必要定义统计员自己设定的任务:简而言之,最具体的形式是统计方法的目的是简化数据。通常只用少量数据就无法进入头脑的数据量,应由相对较少的数据量代替,这些数据量应足以代表整体,或者换句话说,应包含尽可能多的数据,理想情况下应包含整体,原始数据中包含的相关信息。


0

对我来说,以结果为导向(因此不是真正的描述性)的一线

统计学是使人类世界运转的原因,而与自然无关。


3
您是否将统计数字与政治混淆了?还是也许有爱?
ub

@whuber(+1)否。无论是否意识到,两者都基于统计做出大多数决定。
Alecos Papadopoulos'3

2
我现在可以在即将上映的电影中看到它,当男主角跪下来求婚时说:“宝贝,你是我的UMVUE,你愿意嫁给我吗?” :-)(让我们使用收缩率估算器,然后将我们的系数汇总在一起...)
whuber

@whuber(+2)...这是“没有意识到”的部分:这正是男主角的意思,即使他不使用该语言!(我承认我在这里可能犯有哲学帝国主义)。
Alecos Papadopoulos'3

2
您深深受人尊敬的文化背景(因为您的姓名和位置允许人们推断出这一点),至少可以追溯到早期的苏菲派学者,因此您在这方面可以有很大的自由度。:-)
豪伯

0

统计数据是用于通过不确定和/或概率过程对数据生成建模的工具。


-1

统计信息要折磨数据足够长的时间,直到它承认您要显示的任何内容为止。

我在解释罗纳德·科斯(Ronald Coase),请参阅链接


-1,这是要作为面颊的舌头吗?
gung-恢复莫妮卡

@gung是的,不是,我引用了Ronald Coase。
Vladislavs Dovgalecs 2015年

3
根据此处的版本,它充其量是一个不好的表述。这不是关于统计数据的很好的一句话摘要。
gung-恢复莫妮卡

3
@gung好吧,OP问不同的人如何形容它。这将永远是他或她的观点或观点。不同的人会有所不同。OP试图收集不同的意见恕我直言。
Vladislavs Dovgalecs 2015年

2
至强希望Coase编辑您的答案以正确引用并注明出处,这是一种极大的好感。
亚历克西斯

-2

统计学是一门数学科学,它使您能够确定观察值之间的差异是否只是随机的。


1
描述该字段是一个狭窄的子集。
rolando2'3

我有不同的看法。最终,无论您是进行假设检验,回归建模还是任何其他估计,您都最经常测量的是估计与天真的模型之间的差异,还是观察上的差异在统计上是否显着。我的句子抓住了统计显着性与随机性的本质。如果其他人同意,您能否给我一些表决权,因此,仅由于一个人对狭narrow性的主观解释,我认为很容易辩解的评论就不会被视为一个错误的答案。
Sympa 2015年

2
请考虑人们经常使用统计数据试图回答的这些类型的问题:这种分布的形式是什么?这两个变量之间的关系的本质是什么?如何对这些变量进行分组,以便我们可以看到常见的问题/主题/主题/尺寸?如何将许多情况分组,以便我们可以看到常见的类型/配置文件?用因果关系描述这种关系网的最佳方法是什么?什么捕捉了这个变量随时间的趋势?预测未来价值的最佳方法是什么?
rolando2'3

在每种情况下,这些问题的答案都具有很强的统计意义,无论您以任何形状或形式查看的内容与纯粹随机性所产生的内容是否有所不同。对我们大多数人来说,反对票是一个明显错误的答案。我不知道我的答案如何归类。
Sympa 2015年

1
将鼠标悬停在向下投票箭头上方的文本上表示“此答案没有用”。我觉得它很有趣-因此不是没有用-因为它令人深思,但出于几个原因,我并未对此表示赞同。首先是断言,统计数据是一门“数学科学”:这与误解接近(尤其是在某些数学家中)误解是统计数据只是数学的一个分支。第二个问题是似乎只能描述两个样本的假设检验,这是统计数据中非常狭窄的(尽管很普遍)的一部分。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.