为什么贝叶斯统计在统计过程控制中不受欢迎?


18

我对贝叶斯与频繁主义者辩论的理解是,频繁主义者统计数据:

  • 是(或声称是)客观的
  • 或至少没有偏见
  • 所以不同的研究人员,使用不同的假设仍然可以获得定量可比的结果

贝叶斯统计

  • 声称做出“更好”的预测(即较低的预期损失),因为它可以使用先验知识(在其他原因中)
  • 需要较少的“临时”选择,而由具有现实世界解释的先验/模型选择(至少在原则上)代替它们。

鉴于此,我本以为贝叶斯统计将在SPC中非常流行:如果我是一家工厂老板,试图控制自己的过程质量,那么我将主要关注预期的损失;如果我可以减少这种情况,因为我比竞争对手拥有更多/更好的先验知识,甚至更好。

但是实际上,我所阅读的有关SPC的所有内容似乎都是常客(例如,没有先验分布,所有参数的点估计,关于样本大小,p值的许多临时选择)。

这是为什么?我可以看到为什么在1960年代使用笔和纸完成SPC时,经常性统计数据是更好的选择。但是从那以后为什么没有人尝试过不同的方法呢?


2
我认为贝叶斯统计数据是我的Digital SLP相机,而常客身份是iPhone相机。我有一段时间都买了它们,但是我用DSLR少了5%的照片,而其余的则是95%。因为它很容易,随手携带,可以随身携带,而且许多时间都可以按质量提供(基于我的DSLR技能)。就像将先验和运转链整合到干草中一样,我需要找到光圈打开持续时间,长度和其他参数的最佳平衡。iphone端流行。
Ram Sharma 2014年

@RamSharma,您应该将其发布为答案!我喜欢我的厨师刀比喻。
shadowtalker 2014年

Answers:


18

警告我很久以前就写了这个答案,但几乎不知道我在说什么。我无法删除它,因为它已被接受,但是我不能支持大多数内容。


这是一个很长的答案,希望对您有所帮助。SPC不是我的专长,但我认为这些评论足够笼统,因此可以在此处应用。

我认为最常被引用的优势- 融合先前信念的能力 -是应用/经验领域的薄弱优势。那是因为您需要量化您的先验。即使我可以说“好吧,z级别绝对不可思议”,我也无法告诉我在z之下应该发生什么。除非作者开始大量发布原始数据,否则我对先验的最佳猜测是从以前的工作中抽出的有条件的瞬间,这些瞬间可能会或可能不会在与您面临的情况类似的条件下进行。

基本上,贝叶斯技术(至少在概念层面上)非常适合您有强大的假设/思想/模型并希望将其用于数据,然后查看您最终是错还是不错。但是通常您并不想看到您对业务流程的一种特定模型是否正确;您更有可能没有模型,并希望了解您的流程将要做什么。您不想推论得出结论,您想要数据推论得出结论。如果您有足够的数据,无论如何都会发生这种情况,但是在那种情况下,为什么要打扰先前的呢?也许这太过怀疑和规避风险,但我从未听说过一个乐观的商人也能成功。没有办法量化您对自己信念的不确定性,并且您宁愿冒着对错误事情过分自信的风险。因此,您设置了无用的先验,优势就消失了。

在SPC案例中,这很有趣,因为与数字营销不同,您的业务流程不会永远处于不可预测的变化状态。我的印象是,业务流程倾向于有意和渐进地更改。也就是说,您有很长的时间来建立良好,安全的先验条件。但是请记住,先验是关于传播不确定性的。除了主观性之外,贝叶斯主义还具有在深度嵌套的数据生成过程中客观地传播不确定性的优点。对我而言,这确实是贝叶斯统计所擅长的。而且,如果您正在寻找过程的可靠性,而远远超出了20分之一的“重要性”标准,那么您似乎想考虑尽可能多的不确定性。

那么贝叶斯模型在哪里?首先,它们很难实现。坦率地说,我可以在15分钟内教OLS给机械工程师,然后让他在另外5个Matlab中进行回归和t检验。要使用贝叶斯,我首先需要确定我适合哪种模型,然后查看是否有现成的库以我公司的某人所知道的语言提供。如果没有,我必须使用BUGS或Stan。然后,我必须运行仿真才能获得基本答案,而在8核i7机器上这大约需要15分钟。快速原型制作非常重要。其次,等到得到答案时,您已经花了两个小时进行编码和等待,而得到的结果却与具有聚类标准错误的频繁随机效应所得到的结果相同。也许这一切都是自欺欺人,我完全不了解SPC。

我将贝叶斯主义比作高质量的厨师刀,汤锅和炒锅。频繁使用就像是一个厨房,里面装满了电视上看得见的工具,例如香蕉切片机和面食锅,锅盖上有孔,便于排水。如果您是一位经验丰富的厨师,并且在厨房中拥有丰富的经验-实际上,您在拥有丰富知识的厨房中既干净又有条理,并且知道所有物品的存放地点-您可以通过少量选择来做一些很棒的事情优雅,优质的工具。或者,您可以使用一堆不同的小工具,这些工具需要使用零技能,来制作一顿简单的饭,实际上还算不错,而且有几种基本的口味可以使您理解。您刚从数据矿山回家,却渴望获得结果。你是哪位厨师?

*贝叶斯是临时的,但透明度较低。您的辅酶有多少葡萄酒?不知道,您盯上了它,因为您是专业人士。或者,您不能说出黑比诺和黑比诺之间的区别,但是Epicurious上的第一个配方说要使用2杯红色的,这就是您要做的。哪一个更“临时”?


1
+1,好答案。我很好奇:您能否添加一个有关小样本/自适应样本大小的段落?在SPC中,3-5个样本大小似乎很常见。而且,如果SPC软件可以在2个样本后告诉技术人员是否真的需要3个样本,那将是一个很棒的功能。对于贝叶斯模型,这几乎是理所当然的:定义测量,假阳性和-阴性的成本,然后估计进行另一次测量与停止测量的预期成本。在常客统计中,您将不得不处理奇怪的停止规则效果(您可以在15分钟内将其教给我吗?)
nikie 2014年

1
至于样本量,问题是,如果我知道样本量这么小,我会提到这一点,这是因为只有很少的观察,您的估计对您的先前选择非常敏感。您无法从一块石头上取血,所以这是一个折衷:要么您完全偏爱一个常客估算器,但很少假设,或者您将自己的知识(或缺乏知识)整合到一个足够模糊的先验和预测中。基本上都适合你在你的面前有数据 “数据”你必须在你的脑袋。允许您先穿制服。
shadowtalker 2014年

1
从根本上说,贝叶斯一开始就给分析师增加了负担,要动用大脑。我个人认为与设置优先级相反,这表明您要么a)太懒了,要么b)并不真正了解统计数据的工作原理(需要一个人知道一个,等等)。我说很难量化我的答案中的先验。实际上,我实际上不同意这一点。您始终可以做的一件事是在页面上绘制一个钟形曲线,然后问自己“我希望我的数据看起来像这样吗?” 如果不是,请开始调整曲线。而且,如果您不能决定将模式保留在何处,请使用超级优先级。
shadowtalker 2014年

2
一个问题(不是故意的):您确实知道有关于(定量地)征求先前信念的文献,对吗?包括公开的信念,访谈的专家和非专家的信念以及自我信念。我问的原因是,我以前曾听过此投诉,但这些投诉的作者认为,他们的反对是讨论的结束,而不是调查的开始。
Alexis 2014年

1
@CliffAB有趣的……我还没有深入地阅读过这些文献(数十年前的伯纳多,卡斯,加思韦特……)……但这对您来说是一本有价值的科学:不同的先验信念告诉人们是偏爱常客还是贝叶斯方法。;)
Alexis

5

在我的拙见中,贝叶斯统计数据存在一些缺点,与它的广泛使用相冲突(在SPC中,但在其他研究领域中也是如此):

  1. 相较于常客变量,要获取估计值要困难得多(统计学中最广泛的部分采用常客变量方法。顺便说一句,调查这是贝叶斯统计有限普及的原因还是其影响将很有趣。 )。

  2. 贝叶斯统计通常会在处理同一问题的不同方式(例如,哪个先验先机?)上施加选择,而不仅仅是单击查看(无论如何,也不应该在常人制框架下鼓励这种方法)。

  3. 贝叶斯统计中的某些主题比经验不足的统计学家难以管理(例如,先验知识不正确));

  4. 它要求进行敏感性分析(通常在常客制框架下避免使用),以及某些主题的例外情况,例如缺失数据分析。

  5. 它只有一个(值得赞扬的,免费下载)软件可用于计算。

  6. 需要更多的时间是一个自主的研究员贝叶斯比频率论者的工具。


6
好的答案,但我不同意第5点:我可以想到许多用于贝叶斯分析的不同(免费)软件:WinBUGS,OpenBUGS,JAGS,Stan,PyMC ...而且我相信还有更多。我要说的是,所有这些软件的学习曲线都很陡峭,需要大量的编程和统计知识。
COOLSerdash 2014年

COOLSerdash是正确的,我欢迎您进行澄清和评论。我在列出贝叶斯分析软件方面缺乏全面性,可能是由于我(对)WinBugs的(松散)熟悉。
卡洛·拉扎罗

@CarloLazzaro我也同意COOLSerdash关于#5的观点:从版本14开始,私有许可但仍为主流的统计软件包Stata现在将贝叶斯模型和估计合并到香草软件包中。我认为贝叶斯计算可用性只会增长。但是您的其他观点很重要,应该有助于告知贝叶斯支持者的议程。
亚历克西斯

@Alexis:作为Stata用户,我对它最近的贝叶斯风格感到满意。作为一个更普遍的想法,我会保证在大学的统计课上学习频率论者和贝叶斯论者(可能是可能性主义者开始抱怨!!)。
卡洛·拉扎罗

3

原因之一是贝叶斯统计一直到1990年左右才被冻结在主流之外。当我在1970年代研究统计时,它几乎是异端(不是到处都是,而是在大多数研究生课程中)。大多数有趣的问题都是棘手的,这无济于事。结果,几乎今天正在教授统计学(以及审阅期刊文章和设计课程)的每个人都被训练为常客。随着马尔可夫链蒙特卡洛(MCMC)方法的普及,情况开始发生变化,1990年左右逐渐进入SAS和Stata等软件包。我个人认为它们将在10年内变得更加普遍,尽管在专用应用程序(SPC)中它们可能没有太多优势。

开发STAN软件包的小组(mc-stan.org)希望使贝叶斯分析得到更广泛的应用。


欢迎来到我们的网站!请注意,它是“ Stata”而不是“ STATA”-当我自己将其大写时,我在Stata用户方面走错了路!(我以为这就像是SAS,SPSS等,但显然不是...)
Silverfish
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.