统计不是数学吗?


20

统计是数学吗?

鉴于所有数字都是由数学系教授的,并且您获得了数学学分,我想知道人们说这些数字时只是半开玩笑,比如说这只是数学的一小部分,还是只是应用数学。

我想知道像统计之类的不能在基本公理上构建所有内容的东西是否可以算作数学。例如,值是为了理解数据而出现的概念,但这不是更基本的原理的逻辑结果。p


10
强制性XKCD参考:xkcd.com/435。无论如何,真的重要吗?
nico 2013年

2
(i)我们如何量化这些事情?好像这不是调查的主题!(ii)计算几乎总是涉及数字,但在我看来,使统计成为统计数字的因素通常不在计算之内。(iii)当我读本科统计学专业时,它不在数学系。我在两个相当知名的统计学家的带领下攻读博士学位的地方也不是数学系。(iv)我不认为这是个玩笑。它涉及一个非常重要的想法-使统计成为“统计”的原因更多是关于特定类型问题的推理方式。
Glen_b-恢复莫妮卡

6
我曾经有一个简短的答案,因为我曾经是纯粹的数学家(博士学位,在某种代数领域有3.5年的博士后经验),现在是一名应用统计学家...嗯,您可以从应用统计学中学到的那种统计学,例如“ 对于数学家来说,我什么时候使用检验”或不使用检验,看起来像一本食谱书,而不是数学。但是,例如,范德瓦特(Van der Vaart)的《渐近统计》(Asymptotic Statistics)绝对是一本数学书...有很多中级课程-其中一些人选不多,我认为没有足够的书来解释统计数据,其中包含许多真实的例子以及所有数学知识细节。t
猫王

5
我不知道该怎么做,“值,这个概念是为了理解数据而出现的,但这不是更多基本原理的逻辑结果”,我什至不确定甚至可以是对还是错。它似乎主要是从混乱的前提出发。p
gung-恢复莫妮卡

12
@Guy通过类推,我们可以将化学(另一个“数学学科”)描述为渐近分布理论和C *代数。这样做名义上是准确的,但却完全错过了化学的本质及其目标,因此没有化学家会认识到它。同样,将您的描述与主要专业协会所说的统计数据进行对比:它们是天壤之别。“从数据中学习以及测量,控制和传达不确定性的科学。” 那里没有人提到概率。
ub

Answers:


15

数学处理的理想化抽象(几乎总是)具有绝对解,或者通常不存在这种解的事实通常可以得到充分描述。这是从简单公理中发现复杂但必不可少的结果的科学。

统计信息使用数学,但不是数学。这是有根据的猜测。在赌博。

统计学不处理理想化的抽象(尽管它确实使用某些作为工具),但它处理现实世界中的现象。统计工具通常会做出简化的假设,以将凌乱的现实世界数据减少到适合已解决的数学抽象的问题域的某种程度。这使我们能够进行有根据的猜测,但这实际上就是统计数据的全部:进行非常有根据的猜测的技巧。

考虑使用p值进行假设检验。假设我们正在检验一些假设,并且在收集数据后发现p值为。因此,我们拒绝原假设,而支持替代假设。α=0.010.001

但是,这个p值到底是什么?有什么意义?我们开发了测试统计量,使其符合特定的分布,可能是学生的t。在原假设下,我们观察到的检验统计量的百分位数是p值。换句话说,p值给出了我们得到的值与观察到的检验统计量相距分布预期(或更远)的可能性。显着性水平是一个相当随意的经验法则截断:将其设置为等效于说:“如果该实验的每100次重复中有1次表明我们拒绝该空值,即使该空值实际上是真实的,也是可以接受的。 ”0.01

p值使我们有可能在零值是真实的情况下观察到手头的数据(或者更确切地说,是从某种程度上讲,我们在零值假设下观察到的数据至少给我们提供了极高的n值)。检验我们发现的统计数据)。如果我们要拒绝零值,那么我们希望这个可能性很小,接近零。在我们的特定示例中,我们发现,如果原假设为真,观察收集到的数据的概率仅为,因此我们拒绝了原假设。这是有根据的猜测。我们永远无法真正确定使用这些方法得出的虚假假设是错误的,我们只是对我们的证据对替代方法的支持程度进行了度量。0.1%

我们是否使用数学来计算p值?当然。但是数学并没有给出我们的结论。根据证据,我们形成了有教养的观点,但这仍然是一场赌博。我们发现这些工具在过去100年中非常有效,但是未来的人们可能会对我们方法的脆弱性感到惊讶。


6
p值不是当我们拒绝原假设时我们错了的概率,因为它还取决于H1,而H1并不参与p值的计算(如i.stack.imgur.com/tStr4所示) .png -H0错误且太阳爆炸的概率小于p = 1/36)。
迪克兰有袋博物馆,2013年

您能否建议对p值进行更好的简单语言解释?“给定空值的情况下,我们观察到手边的数据的可能性为真”?在p值示例中,我已经比我打算的要深入得多。我的目的是针对统计数据,而不是提供有关解释p值的教程。我不想太出轨。无论如何,感谢您指出这一点。
大卫·马克思

2
p值是一个结果的至少概率极端作为观察如果零假设为真。零假设的合理性与p值之间的联系在很大程度上是主观的,而不是逻辑上的必然性,这一点虽然很好(+1)。最近,我一直在想,频繁主义者的假设检验是否比贝叶斯方法更不具有主观性,在贝叶斯方法中,至少使主观性更为明确。
迪克兰有袋博物馆,2013年

我不清楚您的p值解释/定义与我在上一条评论中提供的替代方案有何不同。经常性假设检验中肯定存在一定程度的主观性,但是在解释贝叶斯因子时,这种主观性也与之相同。并不是说没有传达出重要程度(即在此也明确了主观性),通常只是根据惯例进行选择,而通常在选择(信息性)贝叶斯先验时要考虑更多的问题。
大卫·马克思

1
@David:“至少极端”产生了很大的不同-空值下观察值的概率通常不是p值,即使对于有意义的离散测试统计也是如此。我知道这与您提出的要点相切,但是如果Wikipedia可以正确解决问题,我们应该可以进行交叉验证。
Scortchi-恢复莫妮卡

10

舌头紧紧贴在脸颊:

爱因斯坦显然写道

至于数学定律所指的是现实,还不确定。就他们所确定的而言,他们没有提到现实。

因此统计数据是描述现实的数学分支。; o)

我想说统计是数学的一个分支,就像逻辑是数学的一个分支一样。它当然包含着哲学的元素,但我认为这不是数学的唯一分支(参见莫里斯·克莱恩,《数学-确定性的丧失》,牛津大学出版社,1980年)。


2
逻辑数学的一个分支?包括三值逻辑和模态逻辑,还是一阶谓词演算?所有形式科学都是数学吗?
Scortchi-恢复莫妮卡

我认为对根据一套规则(例如形式语言)操纵符号的任何系统的研究都是多种数学,所以是的,我想我可能会。标签的问题在于它们并不总是完全描述它们所应用的所有内容(我不会说我是数学家,统计学家还是计算机科学家,但我在这三个方面都有某些方面)。同样,同一件事通常可以放置在多个层次中,因此也许没有唯一的解决方案!
迪克兰有袋博物馆,2013年

通过你的论点统计,截至现实的描述,包括几何和量子场论,太,但它不包括假设检验(因为大多数的假设是禁忌的事实-它们要被证伪-因此显然做 “描述现实”)。
whuber

爱因斯坦的名言只是脸颊上的舌头,并不是要认真对待。我敢肯定,这与爱因斯坦的想法根本不符!
迪克兰有袋博物馆,2013年

5

好吧,如果您说“ 像统计之类的东西,那么您就不能在基本公理上构建所有东西 ”,那么您可能应该读一下Kolmogorov的公理概率论。Kolmogorov用抽象和公理的方式定义了概率,正如您在第42页的pdf此处的第1页及后续页面的底部所看到的那样。

只是为了让您了解他的抽象定义,他将随机变量定义为“可测量的”函数,如此处更“直观”地解释的:如果随机变量是函数,那么我们如何定义a的函数随机变量

公理的数量非常有限,并且使用(再次使用数学)度量理论的结果,他可以以抽象的方式定义概念,包括随机变量,分布,条件概率……,并得出所有众所周知的结果,例如大数定律,从这套公理中 我建议您尝试一下,您会对它的数学美感感到惊讶。

有关p值的解释,请参阅:误解了p值?


1
但是,概率论(数学)与其在推理问题(统计)中的应用之间是否还没有重要的区别?贝叶斯和频繁论者的方法显示了使用相同的数学工具(通常或几乎)使用完全不同的概率概念。
Scortchi-恢复莫妮卡

@Scortchi:我不确定概率论者对于贝叶斯主义者和贝叶斯主义者是否有所不同;看到stats.stackexchange.com/questions/230415/...

我的评论与您的​​回答之间没有任何分歧,贝叶斯与频繁主义者的辩论是否有任何数学基础?。所谓“数学仪器”,是指根据科尔摩哥罗夫的公理得出的结论。所谓“概念”,是指限制频率,信念程度等。
Scortchi-恢复莫妮卡

3

我没有严格的或哲学的基础来回答这个问题,但是我听说人们经常会以物理形式来抱怨“统计不是数学”。我认为人们希望通过数学来保证确定性,而统计学(通常)通常仅提供与p值相关的概率结论。实际上,这正是我喜欢统计数据的地方。我们生活在一个根本不确定的世界中,我们会尽力去理解它。考虑到所有方面,我们做得很好。


2

也许是因为我很专业并且没有上过任何高级数学课程,但是我不明白为什么统计不是数学。这里和一个重复的问题的论点似乎争论了为什么统计不是数学的两个主要问题*

  1. 它不是精确/确定的,因此依赖于假设。
  2. 它将数学应用于问题,并且只要您应用数学就不再是数学。

不精确,使用假设

假设/近似对许多数学很有用。

我相信我在小学时学到的三角形的属性被认为是真正的数学,即使它们在非Elucidean几何中并不成立。显然,对数学分支承认限制或以另一种方式“假设XYZ以下内容有效”对数学分支不会取消该分支成为“真实”数学的资格。

我确定微积分可以被认为是一种纯粹的数学形式,但是限制是我们建立数学的核心工具。正如我们可以不断增加样本量一样,我们可以继续计算到极限,但是都不能提供超过特定阈值的洞察力。

一旦应用数学就不是数学

这里明显的矛盾是我们使用数学来证明数学定理,没有人认为证明数学定理不是数学。

thing x如果使用数学来获得结果,那么下一个语句可能不是数学。那也没有任何意义。

我同意的说法是,当您使用计算结果做出决策时,该决策不是数学上的那并不意味着导致这个决定的分析不是数学

我认为当我们使用统计分析时,所有执行的数学运算都是真实的数学运算。 只有当我们将结果交给某人进行解释时,统计信息才能退出数学。 这样的统计学家和统计学家从事的都是真正的数学家,也是真正的数学家。由业务人员进行的解释和/或由统计学家将结果转换为业务所需的不是数学。

从评论:

胡说

如果您要用“化学”,“经济学”,“工程学”或任何其他使用数学的领域(例如家庭经济学)代替“统计”,那么您的论点似乎都不会改变。

我认为“化学”,“工程学”和“平衡支票簿”之间的主要区别在于,这些领域仅使用现有的数学概念。据我了解,像Guass这样的统计学家扩大了数学概念的范围。我相信(这可能是很明显的错误),为了获得统计学博士学位,您必须以某种方式为扩大数学概念的范围做出贡献。据我所知,化学/工程博士学位的候选人没有这一要求。

统计有助于数学概念的区别是它与使用数学概念其他领域的区别。


*:值得注意的例外是此答案有效地指出了由于各种社会原因造成的人为边界。我认为这是唯一的正确答案,但是其中的乐趣在哪里?;)


1
如果要用“化学”,“经济学”,“工程学”或任何其他使用数学的领域(例如家庭经济学)代替“统计”,那么您的论点似乎都不会改变。因此,它似乎没有任何实质内容。
ub

统计博士不必“为数学概念做出贡献”。多数统计博士学位的获奖者是对统计方法统计理论的贡献。(很少有数学家关注统计文献。一般来说,这不是新的或富有成果的数学思想的好来源。在这里,我不是指概率论中的文献。)此外,化学家,工程师,物理学家等在工作中经常创造(或通常重新创造)数学思想;并不会自动将其领域变成数学的分支。
ub

@whuber这很有趣。好像我没有脚要站立。
Erik

1
作为记录,我没有拒绝您的捐款。对于许多人来说,这是一个敏感的话题,例如,许多大学数学系仍在试图将统计学家视为数学家,这对两者都不利。因此,它很可能引起一些强烈的反响。
ub

2
@whuber无论如何我都足够坚强地忍受一些低票。:)我认为您一直都应尊重您,所以不必担心。除了投票之外,匿名也是有原因的。无需继续记录。
Erik

2

统计测试,模型和推论工具是用数学语言表达的,统计学家已经在数学上证明了厚厚的书,这些书中有非常重要且有趣的结果。在许多情况下,证明提供了令人信服的证据,证明所讨论的统计工具是可靠和/或强大的。

对于具有一定品味的数学家来说,统计及其社区可能还不够“纯粹”,但它绝对是对数学的极深投资,而且理论统计与理论物理学或理论计算机科学一样,也是数学的一个分支。


2
嗨,保罗,正如您所说,统计数据充满了很好的定理和证明(+1),正如我在回答中所解释的,甚至还有一个由公理式的概率概率理论,由科莫格洛夫(Kolmogorov)开发。

-2

“差异”取决于:归纳推理演绎推理推理。例如,没有任何数学定理可以告诉您数据/模型可以使用哪种分布或先验。

顺便说一下,贝叶斯统计是一个公理领域。


数学也需要归纳推理...
Elvis

@Elvis是的,这就是为什么我的示例...我确定您知道此问题没有一般答案...为了您的方便,我已编辑了答案...
Compay Segundo

我真的不明白你的意思。
猫王

@CompaySegundo:我不确定这里是否有一个有效的观点,至少没有明确说明。
Quora Feans 2013年

1
@QuoraFea可能我太醉了……
Compay Segundo

-2

这可能是一种非常不受欢迎的观点,但是鉴于统计学(和概率论)概念的历史和表述,我认为统计学是物理学的一个分支。

确实,高斯最初在天文预测中正式确定了最小二乘回归模型。在费舍尔之前对统计所做的贡献大部分来自物理学家(或按今天的标准被称为物理学的高度应用的数学家):李雅普诺夫,德莫夫,高斯以及一个或多个伯努利斯。

首要原则是对错误的表征以及从无数个无法衡量的变化源中传播的看似随机性。随着实验变得越来越难以控制,需要正式描述实验错误并加以说明,以校正实验证据相对于所提出的数学模型的优势。后来,随着粒子物理学深入研究量子物理学,将粒子形式化为随机分布提供了一种更为简洁的语言来描述看似不可控制的光子和电子的随机性。

估计器的属性,例如平均值(质心)和标准偏差(偏差的第二矩),对物理学家来说非常直观。大多数极限定理可以与墨菲定律松散地联系在一起,即极限正态分布是最大熵。

因此,统计是物理学的一个分支。


5
这是不合理的,也是不合逻辑的。正如斯蒂芬·斯蒂格勒(Stephen Stigler)在他的书中指出的那样,心理学家,经济学家和大多数其他社会科学家在长达一个世纪的时间里都没有采用物理学家的方法,这是由于人们对它们的适用性和解释存在真正的怀疑。这是表面现象的初步证据,证明统计学远远不只是物理学的一个分支。从工程学到生物学的其他学科也采用物理方法和物理理论,但这也没有使它们成为物理学的分支,至少没有以任何有意义或有见地的方式。
whuber

伯努利对概率的兴趣不是源自赌博而非物理学吗?
迪克兰有袋博物馆,2013年

@whuber与我的生物统计学领域一样,我敏锐地意识到,这些应用科学在以独特的方式被确定为科学领域之前就以各种形式存在。我相信,尽管这些领域在统计学领域本身之前已经正式出现。对于物理学当然不是这种情况。这些应用科学的一个中心主题是将过程表述为将某些预测因子与响应联系起来的模型。统计学的语言也许部分是由于需要概括适用于这些领域的概念而诞生的。
AdamO 2013年

1
你的思维雅克布斯伯努利,追授作者ARS conjectandi(编辑Nicholaus伯努利,1713)。也许最后一个似乎受到赌博问题激励的人是1654年的帕斯卡(Pascal)和费马(Fermat),但即使到那时,他们似乎仍在使用某些赌博问题(“积分问题”)只是一个激励性的例子,而不是他们的关注重点。他们的调查。(现代学术实际上是将点的问题追溯到伊斯兰合同法c。1200。)真正受赌博激励的最后一位著名的数学家可能是卡尔达诺(1501-1576)。
ub

1
Diaconis 魔术师?我不会将赌博与表演技巧混为一谈!您的观点是正确的,但您可以通过暗示许多“投资者”实际上是赌徒来稍微好一点,因为许多数学理财理论家可能真正地受到这种赌博形式的激励。只是一个想法……无论如何,很明显,惠更斯在1657年发表他的小论文时,人们正在创造一种概率论(和统计学),其原因远比在赌台上做得更好更深刻,影响深远。 。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.