哪些误用的统计术语值得纠正?


103

统计无处不在;但是,统计术语的常用用法通常不清楚。

尽管概率赔率的定义明确且数学表达式不同,但它们在普通英语中可以互换使用。

在乳房X线检查为阳性的情况下,没有将可能性一词与概率从常规上分开会使医师试图量化乳腺癌的概率感到困惑,“哦,这是胡说。我做不到 你应该测试我的女儿;她正在学习医学。”

同样地,传播是使用相关而不是关联。或相关性暗示因果关系

在戈尔的纪录片著名难以忽视的真相,幻灯片说明了相关冰芯的和温度,使更多的技术工作,以证明因果关系进行讨论:CO2

在此处输入图片说明

问题:在不严格使用数学的情况下,哪些统计术语会引起解释问题,因此值得纠正吗?


4
外行中的赔率与概率似乎对我来说不是问题,因为外行无论如何也不会计算它们,他们只是说这些值是低还是高,并且两者直接相关。
Mehrdad

@Mehrdad,我同意。实际上,这才是关键……在任何情况下,滥用在统计范围内被采用和技术化的这些词语会导致问题。例如,很明显,气候变化背后有重要的研究机构,但在许多其他情况下,可以通过暗示关联等于因果关系来做出虚假主张。在赔率和机率的情况下,任何一个都可以转换为另一个,因此唯一的风险就是误解您的投注。
Antoni Parellada

3
@Mehrdad关于赔率的观点很有趣,但我认为它比让人眼前一亮还要复杂。外行人谈论赔率时,通常指赌博赔率,而且通常以“赔率反对”的形式表示。因此,在大多数人熟悉的系统中,赔率与概率相关联,而对于统计学家而言,高赔率与高概率相关联。因此,这已经很容易让人困惑了:另请参阅我们的几率:简单的几率
Silverfish

5
可能需要记住的是,其中一些术语是英语预先存在的(含义较宽松),在被统计数据使用之前,给出了严格的技术定义。收起这个词,改变意思,然后四处责骂别人用旧的,非技术性的定义来使用它是错误的,这有点凝聚。
RM

我真的不喜欢将测试称为“事后”,即使它们是事先计划好的。我认为这始于一些统计数据包,但现在已经很普遍了。
David Lane

Answers:


101

对抗语言变化可能是徒劳的。但

参数不表示变量

在古典统计中,这种情况恰好始于首先使用具有这种含义的术语的费舍尔(RA Fisher),参数是要估计的未知常数,例如总体平均值或相关性。在数学中,有相关但不相同的含义,就像曲线是通过参数方式给出的一样。在许多科学中,参数只是用于度量(本身是具有数学意义的稠密术语),属性或变量(视具体情况而定,例如长度或电导率或孔隙率或美德)的另一个词。自然地,一个人的身长或美德在被测量之前是未知的。但是使用统计方法的人可能会对它在一系列此类测量中的使用感到困惑。用普通或粗俗的说法,参数(几乎总是复数)通常是指某种事物的局限性,例如人际关系或政治​​政策,这可能是由于最初对周界的困惑所致。有较高的先验概率,可以假定贝叶斯主义者会根据自己的用法为自己说话(对@conjugateprior表示感谢)。

倾斜并不意味着有偏见

一个世纪或更长时间以来,偏斜具有一种特殊的统计意义,即指的是分布的不对称性,无论是图形评估,数字度量还是理论上基于信念或希望而假定。长期以来(大概可以猜测),偏差意味着平均而言是错误的,只要我们知道真相,即真实或正确的值,就可以将其量化为系统误差。用普通语言歪斜通常具有扭曲或扭曲的常识,因此是不正确的,错误的,因此也带有偏见。这种感觉(据我所知,直到最近才开始出现)已开始渗入统计讨论中,因此偏斜度的原始含义处于被模糊或淹没的危险中。

相关并不意味着一致

相关性在统计中吸引了几种精确的意义,它们共同具有在某种精确意义上完美的双变量关系的思想:主要情况是线性和单调关系。即使在统计讨论中,它也经常被稀释以表示几乎任何类型的关系或关联。相关性不一定意味着是一致的:因此,只要,意味着皮尔逊相关性是 或,但是一致要求非常严格的条件。y=a+bx11b0y=xa=0,b=1

独特并不意味着与众不同

将数据的不同值称为唯一是很常见的,但在理想情况下,唯一性仍然更好地保留为唯一的含义。我自己的猜测是,某些责任归咎于Unix [sic]实用程序uniq及其模仿程序,它们将可能重复的值减少为每个值实际上都是唯一的集合。在这种猜测下,用法使程序的输入和输出更加紧凑。(相反,如果我们谈论的重复数据,我们很少限制自己,发生两次精确doubletons。术语重复从语言上讲会更有意义,但由于在实验中故意复制控件而被优先考虑;得到的响应值通常根本不相同,这很重要。)

样本很少重复

在统计数据中,一个样本包含多个值,重复采样是一种很高的理论优势,但很少有人实践,除非通过模拟(这是我们对任何形式的计算机伪造的惯用术语)。在许多科学中,样品是单个对象,由块状,块状或团状的水,土壤,沉积物,岩石,血液,组织或其他物质(从吸引到良性到令人恶心)组成。绝非例外,对任何认真的分析而言,取样都是必不可少的。在这里,每个领域的术语对它的人民来说都是很有意义的,但是有时需要翻译。

错误通常并不意味着错误;正如哈罗德·杰弗里斯(Harold Jeffreys)所指出的那样,主要意义是不稳定的,而不是错误的。

不过,我们应该警惕自己的过失或术语怪癖:

回归不退步

固定并不意味着固定或固定

自信与任何人的心理或心理状态无关

意义有时只是日常意义

“精确”通常是一个称呼术语,指的是一种易于处理的解决方案或计算方式,而不是一种适用于该问题的解决方案

右偏的分布到许多看起来偏左,反之亦然

对数正态分布是所谓的,因为它是一个正常幂

但对数正态比正常正常

高斯被棣莫弗发现

泊松没有发现泊松,更不用说泊松回归了

引导程序不会帮助你与你的鞋

刀切不剪

峰度不是医疗状况

茎叶图不涉及植物

一个虚拟变量是有用的,而不是无意义或笨

地球上(或其他任何地方)谁认为异方差确实是比不均等可变性更好的术语 ?

现在,robust对于不同的群体至少具有两个主要的技术含义,这两个含义都不能阻止其频繁使用,即使在技术讨论中也仅意味着“主张行为良好”之类的含义。

IV现在对于不同的群体至少具有两个主要含义

对于不同的群体,因素现在至少具有两个主要含义

标准化标准化具有无数的含义(我们确实需要在那里标准化)

相对于描述图形表示垂直变量水平变量,除非相反

(最后但并非最不重要的一个说法)统计数据至少具有三个主要含义。

笔记:

  1. 尽管有相反的表象,但我认为这是一个很好的严肃的问题。

  2. 时尚转变。进入20世纪,似乎很多人(没有名字,没有打pack,但可以提到卡尔·皮尔森)只能通过接触希腊语和拉丁语字典来发明术语。(不给他散点图的信誉是不公平的。)但是,RA Fisher确实劫持了许多先前存在的英语单词,包括差异充分性效率可能性。最近,JW Tukey是家常便饭的高手,但很少有人会感到沮丧,因为杂乱不良习惯没有流行

  3. 有人评论说,“生活是可乘的,而不是累加的:对数正态分布比正态更正态。” 阿农 1962年。Bloggins的工作规则。在《良好》中,IJ(编辑)的科学家推测:部分出炉的思想选集。伦敦:海涅曼(Heinemann),212-213页(第213页的报价)。


评论不作进一步讨论;此对话已转移至聊天
ub

异方差完全震撼了猫的盒子!“可变性是否相等?” [Phuagh!])(否则+1非常好;)
Alexis

1
可能值得补充的是,回归测试通常在软件开发的上下文中使用,从广义上讲,回归测试是指向后进行。
康拉德

@Konrad有趣,但是(如果我错了,请纠正我)(a)不会滥用该词,并且(b)那里的词没有统计学意义。
尼克·考克斯

@NickCox正确。
康拉德

33

我遇到的一些事情:

  1. 将显着性水平和CI覆盖概率视为可互换,这样人们最终会做诸如说“ 95%显着性”之类的事情。

    [更糟糕的是,犯错的人指着他们的讲义甚至教科书作为支持;换句话说,错误不是他们的错误,而是被加百倍甚至数千倍的错误,更糟糕的是,即使他们正确地理解了错误,他们仍然可能不得不重复错误以通过主题。

  2. 还有一种普遍的趋势,认为“重要性”以某种方式存在于特定的假设/问题之外(导致诸如“我的数据是否重要”之类的问题,而没有明确要解决的问题)。[一个相关的问题是“我应该对这些数据使用什么测试?” 就像是数据(而不是要回答的问题)一样,这就是选择分析的动因。(虽然研究的“设计”可能会影响所使用的特定测试,但关注的问题更为重要-例如,如果您有三个可用的组,但是您所关注的问题仅涉及两个组的比较,事实上,您只有三个人,并不强迫您进行单向类型分析,而不是直接比较两组感兴趣的对象... 只要您选择的分析方法不是从数据显示中得出的。理想情况下,您在拥有数据之前先计划问题和分析,而不是对数据进行分析并查看结果,这似乎是事后分析问题-包括“我应该对这些数据使用什么测试?” -倾向于导致。)

  3. 一种偶然的趋势是将p值的补语称为替代的某种“信心”或“可能性”。

  4. “非参数数据”;不幸的是,在几本书中发现了另一本书(可悲的是,在一篇旨在纠正常见错误的文章中),这一本书出现的频率很高,以至于它出现在我自动生成的注释的简短列表中(以“数据既非参数化也非参数化,非参数的;那些是适用于模型或技术的形容词...“)(感谢Nick Cox提醒我这个特殊的错误)

    通常所指的是“非正常数据”,但参数并不意味着正常,具有近似正常性并不意味着我们需要参数过程。同样,非正态性并不意味着我们需要非参数过程。偶尔会使用“常规数据”或“名义数据”,但这两种情况均不表示有限参数模型是不合适的。

  5. 一种常见的趋势是以一种与“广义线性模型”中术语“线性”的使用不一致的方式来误解“线性模型”中“线性”的含义。这部分是我们使用术语方式的错误。

  6. 将平均负中位数的偏度与三阶矩偏度相混淆,并将其中一个(或什至两者)中的零与对称性相混淆。在某些特定应用领域广泛使用的基础文本中经常发现这两种错误。[将零偏度和零过量峰度视为正常是有相关的错误]

  7. 这种现象是如此普遍,以致于再也很难将其称为错误(部分原因是由于特定程序的努力)-将过多峰度简称为“峰度”;一个错误几乎可以保证导致沟通问题。


2
+1。我想提醒您一个怪诞的“非参数数据”,它比我的列表中的名称更好。峰度过高是粗峰度的丑陋兄弟姐妹。
尼克·考克斯

@尼克谢谢,我一直坐在这里盯着我的名单说:“还有其他一些让我很生气的事,我知道我属于这里”。就是那个。
Glen_b

3
另一个是“统计测试”扩展得如此之广,以至于成为一个悬而未决的问题:我应该对数据应用哪种测试?通常会相信会有“学生的t”,“曼恩·惠特尼”或“卡方”形式的单个答案。我的答案通常是更通常的答案,也许根本没有答案,或者我们必须仔细查看您的数据并讨论您真正的问题是什么,然后我们才能进行思考。
尼克·考克斯

@nick那个与我的项目2密切相关。我想知道是否有一个很好的方法来扩展那个项目。
Glen_b

1
我担心许多统计文本(似乎)会鼓励这种思维。
尼克·考克斯

31

数据 ”是复数的。(单数是“基准”)。


2
您真的在谈论基准吗?更通常地,至少是关于那个点……那个价值……那个观察……。
Nick Cox

5
数据也是一个奇异的机器人,它吸收有关他观察到的人类的数据,以得出数据驱动的数据结论,通常会产生幽默效果。
马修·德鲁里

2
您必须走很长一段路才能听到。
Nick Cox

5
多个数据不仅需要动词的一致性-“数据是”而不是“数据是”,而且还需要量词的一致性-“很多数据”而不是“很多数据”,“更少的数据”而不是“较少的数据”。很少有人设法保持一致,这似乎是一个失败的原因。
Scortchi

5
尽管已经为此奋斗了数十年(近几十年来)(我的拉丁老师会很高兴),但我还是得出了类似于@Scortchi的观点。但是我尝试在可能的情况下使用单词数据集,特别是受StataCorp做法的影响。这就解决了一些困难。
尼克·考克斯

14

尽管不是严格意义上的统计术语,但我投票决定退出内生性。当人们真正想做的事情是说:“无法确定这种影响”时,它通常用来指代从反向因果关系到混杂因素到选择和对撞机偏见的所有事物。


评论不作进一步讨论;此对话已转移至聊天
Glen_b '16

13

“向均值回归”并不意味着如果我们观察到一定数量的iid样本低于预期值,则下一个iid样本可能会高于预期值。


3
+1这很重要。著名的人对此感到非常困惑。例如,彼得·伯恩斯坦(Peter Bernstein)的流行书《风险分析》,《反对众神》。以多种不同的方式对均值进行回归分析-其中没有一个是正确的。
ub

10

百分比与百分比点:如果某物从1%增加到2%,则增加了100%。或者:您可以说它增加了1个百分点。

指出增加幅度为1%是非常误导的。


7

我发现没有明确指出的缩写是一个真正的问题。例如,我看到类似GLM的东西,如果这意味着通用线性模型或通用线性模型,则没有指定。通常,在深入研究上下文后,通常可以弄清楚被引用的内容,但是我发现这对于刚开始学习统计模型的学生来说尤其麻烦。

另一个例子是IV。这是指工具变量还是自变量?通常,直到您检查上下文后才能弄清楚。

我看到的其他困惑还包括“主持人”和“互动”。而且,除非非常清楚地说明,人口(和一般人口一样)和感兴趣的人口似乎使新学生感到困惑。


5
我也看到过GLM在机器学习人群中曾经被称为“全局线性模型”。只是增加了本来已经
很重的

1
我部分支持这个答案/观察。我认为“广义”(无论是什么)应该更好地缩写为Gz,而不是G。例如GzLM(广义线性模型)。
ttnphns

2
@ttnphns:我们中的一些人写了一个带有s的概括词
亨利

我很好奇@ttnphns,您不支持该答案的哪一部分,为什么?我很可能对某事有误解,所以我想知道更多是否有进一步的服务。谢谢!
StatsStudent

1
thought,我以为IV意味着体外。= P
Mehrdad

7

日常语言中常见的一种:

平均

对于外面的普通人(完全讽刺意味深长的讽刺),任何东西的平均值,中位数,众数和期望值似乎都相同。他们天生就有做点估计的倾向,并且会无意识且无懈可击地假设存在基础正态分布。同样无意识的假设也有很小的差异。相信这样的估计1)存在和2)对于他们将非常有用,因为他们可以将其视为实际的某个预测变量,这种想法根深蒂固,以至于基本上不可能说服他们。

举一个真实的例子,尝试与问“平均大小的马铃薯是多少”的厨师交谈,绝对可以确定,如果您告诉他一个数字,那么他将能够在指定数字的任何食谱中使用该土豆土豆,每次都能完美呈现。并因为试图告诉他“没有这样的数字”而对您生气。可悲的是,这种情况发生在赌注比制作汤要高得多的情况下。


3
我认为这有点夸张。例如,数百万甚至数十亿的人似乎对平均运动水平几乎没有什么困难。
尼克·考克斯

1
@NickCox当然是上下文相关的。特别是对于给定数据的算术平均值的计算是没有问题的。我已经在我描述的情况下特别看到了麻烦,他们需要点估计并假设“平均值”是非常精确的情况。同样,他们假设此“平均值”是作为平均值计算的,但是,如果您要求他们解释平均值,则它们会大致描述一个模式。
rumtscho

@rumtscho,你是对的。Joe Average可能倾向于将平均值视为模式或典型值。
马克·L·斯通

当人们谈论英国的“平均”房价时,他们无法告诉我他们所使用的平均价格类型,或者是否不包括轮廓线。
伊恩·林格罗斯

1
没有什么说不能为多峰分布计算平均值,只是很多时候,这并不是描述分布的最大方法。而且,我不确定对于统计学家的形象告诉所有人“您不知道平均值一词的含义是什么!然后当他们指向字典定义时,我们回答“嗯,字典也没有!”
Cliff AB

7

峰态不能衡量“言语”。

Z4|Z||Z|

*是否减去3;这一点没有区别。


1
ZZ

1
我有一位希族塞人统计学教授,他告诉我们瘦腿希腊语在希腊语中的意思是“窄肩”或“驼背”。因此,一个轻快态分布(例如,拉普拉斯或双指数分布)在其“肩部”区域的质量小于高斯分布(等方差),而在头部和尾部区域的质量相应更大。相反,扁平囊分布(例如,制服)比正常人的肩部质量更大,头部和尾部区域质量更小。
米科

2
单词的解释很好,但实际上,它们与Pearson开发的峰度统计无关。皮尔森(Pearson)弄错了,但是通过使用那些听起来听起来很古怪的希腊语,他让其他人认为他在做某件事。可悲的是,他的失误已经损害了统计学教育和识字率超过100年。请参阅我的论文,以了解峰度较小的尖峰(“ lepto”)分布,以及峰度接近无限的平顶(“ platy”)分布。皮尔逊的峰度告诉您有关“ lepto”或“ platy”的任何信息。 ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall

5

线性均值:

  • y=a+bxy=a+bx+cx2y=axb

  • y=ea+bx1+ea+bxy=a+bx+xmax(xθ,0)

  • 线性意味着动态的相反。就像因变量是函数一样,它也不是其自身先前值的函数。在这方面,非线性意味着类似和。ý - ý - 1 = 一个+ b ý - 1 - X - X+ c ^ X - X - 1+ d X 1yt=a+byt1+cxytyt1=a+b(yt1xtx)+c(xtxt1)+dxt1

其中是因变量,是自变量,而和是上述所有示例中的参数。X 一个b c ^ d θyxa,b,c,dθ


5

问题是关于统计术语的使用,我们应该注意纠正。我一直在纠正我的千禧一代孩子对“随机”一词的使用,以表示与随机相反的事物已有10年了。考虑到我有多少受训人员努力产生实际上是随机的随机数据样本,而这个样本甚至在使用该词之前就已经发生了,所以在日常lang语中混淆这个术语是一个危机。

从OnlineSlangDictionary:

Definition of random


random

adjective
  • 意想不到的和令人惊讶的。
    All of the sudden this guy jumped out from behind the bushes, it was so random!
    The street cleaner never comes down our street. How random.
    
  • 出乎意料的好。
    The party was totally random.
    

4

格伦和尼克已经提到了很多很棒的例子……还差得远!

回归的某些方面

  • 错误项和残差(当人们感到自豪时,其残差与回归变量无关,这有点可笑)

  • 预测和估计(当它们与预测的随机效应有关时,我们甚至应该停止区分吗?)

  • 预测/预测间隔与置信区间。我认为引用错误的可能性大于0.5。

  • 回归变量(设计矩阵中的列)与协变量等。特别是在必须区分的技术情况下,许多人(包括我自己)往往不精确。


对不起,我很困惑。预测和估计之间有区别吗?您能否也对最后两点做更多解释?谢谢!
yuqian '16

3

特别是在保险环境中,通常使用方差来指代任何类型的差异,而不是指每个数据点与数据集的平均值之间的平方差的平均值。


6
我也遇到过用这种不同含义表示的方差,但是请注意,当19世纪RA Fisher为此目的劫持方差时,方差是一个现有的英语单词。统计人员不能声称拥有真正含义。
尼克·考克斯

3

贝叶斯

学习它的学生可能不会很麻烦地告诉您是否有某些东西“看起来”贝叶斯,但是让他们用常客和贝叶斯方法解决问题,他们可能会失败。

以我的经验,学生最终被教导说这只是一种哲学上的差异,没有具体的例子表明这两种方法都可以解决相同的问题。

现在问他们为什么有人在他们的榜样中可能会采用常客主义的方法。他们最好的解释就是“好吧,在过去,计算机不存在……”


您能否分享您的解释,为什么有人可能会采取常客主义的方法?谢谢!
yuqian '16

4
@yuqian:是的。对我来说,重要的是,当您希望人们客观地同意您的时候,就去做。贝叶斯方法需要先验分布,而先验分布本质上是主观的,在现实世界中,没有一个客观上正确的先验……这意味着两个人可以根据他们对先验的看法来计算同一问题的不同答案。使用常问的方法不会出现此类歧义,因此可以客观地比较您的结果与其他结果。
Mehrdad

2

风险

风险并不代表概率

风险是所有结果的成本之和,其中每一个成本乘以它们发生的可能性。

风险通常与回报(是我们正在努力获得的回报)权衡。

这是一个示例:您的千瓦有多致命。在这里,将风险(使用不同能源的死亡人数)与奖励(这些能源产生的太瓦小时数)进行权衡。

因此,例如:核电的风险不是崩溃的可能性;它是一个灾难会发生的概率乘以那死于它的人,这个数字与总结与从正常运行乘以该业务维持正常的概率死亡的人数。


4
“风险”没有公认的标准定义。但是,“所有结果的成本[损失]的总和,这些成本[损失]中的每一个乘以它们发生的可能性”就是预期成本[损失]的定义。另一方面,风险通常是指与预期损失的(不利)偏差。因此,您的定义是期望,而我认为风险的典型定义涉及分散。
A. Webb

例如,当我们购买保险时,其目的是降低风险(减少不太可能发生的事件的影响),但是被保险人的实际预期成本更高,差异在于保险公司的费用和利润。尾部的极端损失已被换来更稳定的保费成本。
A. Webb

3
@ A.Webb FWIW,(国际)风险分析协会将风险定义为“可能对人类的生命,健康,财产或环境造成不良,不利影响的可能性;风险的估计通常基于风险的预期价值事件发生的条件概率乘以事件已经发生的结果得出的结果。” 因此,风险似乎具有标准定义-它表明您正确地将风险与可能的估计或度量方式区分开来是正确的。
ub

1
流行病学家使用的风险,也指事件发生的概率或。P(A)/t
亚历克西斯

2

固定效应随机效应对不同的人可能意味着不同的事物。在计量经济学中,固定效应实际上是随机的,当您考虑它时,统计中的每个效应都是随机的,因此命名随机变量不会提供任何有意义的附加信息。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.