我想知道是否有一种方法可以判断某件产品(某产品)发生故障的可能性,如果我们在该领域拥有1年的100,000个产品并且没有故障?接下来出售的10,000种产品之一发生故障的概率是多少?
我想知道是否有一种方法可以判断某件产品(某产品)发生故障的可能性,如果我们在该领域拥有1年的100,000个产品并且没有故障?接下来出售的10,000种产品之一发生故障的概率是多少?
Answers:
产品失效的可能性肯定是时间和使用的函数。我们没有任何可用的数据,并且只有一年没有任何故障(恭喜!)。因此,无法从您的数据中估算出这方面(称为生存函数)。
但是,您可以将一年之内的失败视为二项分布。您仍然没有失败,但是现在这是一个普遍的问题。一个简单的解决方案是使用3的规则,该规则对于大(您确实拥有)是准确的。具体而言,可以得到上限单侧95%置信区间(即,下限是0一年内)上出现故障的真实概率为3 / Ñ。在您的情况下,您有95%的信心认为利率低于0.00003。
您还询问了如何计算下一个10k中的一个或多个失败的概率。扩展上述分析的一种快速,简单(尽管极端)的方法是仅将上限用作基础概率,并使用相应的二项式CDF得出不会出现失败的概率。使用代码,我们可以做到:,这有机会在接下来的10k产品中看到一个或多个故障。具有使用上限,这是不是至少有一个失败的概率的最佳点估计,而你可以说这是不太可能的概率≥ 1失败多于≈ 26 %R
1-pbinom(0, size=10000, prob=0.00003)
0.2591851
(认识到这是一个有点“手摇”的帧)。另一种可能性是使用@amoeba根据拉普拉斯继承规则估算的建议。继承的规则规定的故障的估计概率是,其中˚F是失败的次数。在这种情况下,p = 9.9998 × 10 - 06,以及用于的预测概率计算1个+故障在下一10,000 ,产生,或1-pbinom(0, size=10000, prob=9.9998e-06)
0.09516122
。
您可以采用贝叶斯方法。用表示失败的概率,并将其视为随机变量。先验的,你看到的实验结果之前,你可能会认为,Θ 〜ü (0 ,1 )。如果您信任的工程师使这款产品可靠,也许你可以采取Θ 〜ü (0 ,0.1 )左右。这取决于你。然后,您可以使用贝叶斯定理来计算θ的后验分布。表示一个您已经观察到的事件(n个实验,失败次数为零)。
一切都很简单:Θ是均匀的,所以p(θ)是一个常数。既然你运行ñ实验,p(一|θ)不只是概率的故障在ň失败的概率伯努利试验θ。
一旦有了你金:可以计算任何事件的概率乙通过integrateion:P(乙)= ∫ p (乙| θ )p (θ |甲)d θ
下面,我按照上述方法研究详细的解决方案。我将使用一些标准的快捷方式。
让前得到。然后: p (θ |甲)α p (甲| θ )⋅ 1 = (1 - θ )ñ。 归一化常数p (甲)= ∫ p (甲| θ )p (θ )ð θ被发现是乙(1 ,Ñ
用B表示明年产品没有故障的可能性。至少一个故障的概率为1 - P(B )。然后 1 - P(B )= 1 - ∫(1 - θ )m (1 - θ )n
这大概是,使用Ñ = 100 ,000 ,米= 10 ,000。不是很令人印象深刻吗?我对失败的概率进行了统一分配。也许您对工程师有更好的先验信念。
为什么不预测概率有多少产品而不是计算概率?
当时,可使用可比较的公式进行计算
一个上部预测极限为失败的上面提到的最后数量(UPL)票,,是由给定的最小(取决于),用于其中。
的UPL应使用的风险方面解释,之前作为评价或观察。 换句话说,假设是一年前,一旦观察到第一个就要求您推荐一种程序来预测下产品中的故障数量。您的客户问
您的程序将低估的机会是什么?我并不是说以后会有更多数据。我的意思是现在,因为我必须立即做出决定,而我现在唯一可以得到的机会就是现在可以计算的机会。”
您的回应可以是,
现在,该机会不大于,但是如果您打算使用较小的预测,则该机会将超过。
对于,和我们可以计算出
因此,在观察到,
对于高达置信度(即当),预测在接下来的产品中最多有失败。
对于高达置信度(即当),预测接下来的产品中最多有故障。
等等。
这种方法何时,为什么适用? 假设您的公司生产许多不同的产品。在观察了每个个在现场的性能后,它喜欢提供保证,例如“在一年内完全免费更换任何故障”。通过对故障数量具有预测限制,您可以控制必须支持这些保证的总成本。因为您生产许多产品,并且预期失败是由于无法控制的随机情况造成的,所以每种产品的经验都是独立的。从长远来看,控制风险是有意义的。有时您可能需要支付比预期更多的索赔,但是大多数时候您将支付的索赔更少。如果支付的费用比宣布的还要多,可能会设置很小(并且您可能还会使用更复杂的故障模型!)。否则,如果成本很小,那么您可以放心使用(高)。 这些计算表明如何平衡信心和风险。
注意,我们不必计算完整的过程。我们一直等到观察到,然后才执行该特定的计算(此处),如上所示。不过,原则上,我们一开始就可以对所有可能值进行计算。
贝叶斯方法(在其他答案中有描述)是有吸引力的,并且只要结果在很大程度上不依赖于先验方法就可以很好地工作。 不幸的是,当故障率如此之低以致于观察到很少(或没有故障)时,结果对先验的选择很敏感。
以下是贝叶斯答案:“在10,000种新产品中,如果以前生产的100,000种全部都没有失败,预计会有多少种失败?”,但是您应该考虑对不同先验的敏感性。
假设给定,是条件独立且相同分布的,使得,并使用共轭先验,其中。
对于,我们有
对于,我们有 ,其中我们使用了。
使用统一的先验()插入数字,您预计失败率约为,而类似Jeffreys的先验()为您提供失败率接近。
这种预测性预期看起来并不理想,因为预测性分布高度偏斜。我们可以进一步计算预测分布。由于 就像我们 for。
我将在稍后计算预测间隔时完成它。
使用拉普拉斯的日出问题方法,我们得出了产品在一年内失败的概率。接着,概率在一年之内的新产品无失败是 。因此,该至少一个产品的概率将在明年失败是对于该值为。实际上,在胡伯尔的情况下,。
当然,在售出更多产品的同时,您应该继续更新数据,否则最终将失败。
这个问题提供了几个很好的答案,但是最近我有机会复习了与此主题相关的资源很少,所以我决定分享结果。
零故障数据有多个可能的估计量。让我们将表示为失败次数,将为样本量。给定该数据的最大概率估计失败概率
由于我们没有观察到样本中的任何失败的事实几乎无法证明它们是不可能的,因此这种估计相当不令人满意。数据不足的知识表明,即使没有观察到,也存在一定的故障概率(尚未)。具有先验知识使我们能够使用贝利(1997),拉扎吉(2002),巴苏(1996)以及卢德布鲁克(Ludbrook)和卢(Lew)(2009)综述的贝叶斯方法。
在简单的估计量中,假设的“上限”估计量(Bailey,1997年)
在零故障情况下,P的估计器产生的概率超过在一次故障情况下,最大似然估计器预测的概率是合理的上限是不合逻辑的
定义为
可以提到。正如Ludbrook和Lew(2009)所述,其他可能性是“ 三元规则”(参见here,Wikipedia或Eypasch等人,1995)。
或其他变体:
纽康姆和奥特曼(或3.6)的“ 3.7规则”:
“四个新规则”:
但是根据Ludbrook和Lew(2009)的结论,“三分法则”几乎是“无用的法则”,“ 3.6的法则”(和3.7)“有严重的局限性-如果初始样本量小于50,则它们是非常不准确的”他们不建议使用方法(3)-(6),而是建议使用适当的贝叶斯估计量(请参见下文)。
在贝叶斯估计器中,可以提到几种不同的方法。Bailey(1997)提出的第一个这样的估计是
用于估计统一先验下的中位数
或用于估计该先验条件下的均值
假设故障率恒定(泊松分布)的指数故障模式产生的另一种方法
如果我们使用带有参数和 beta优先级,则可以使用公式(请参见Razzaghi,2002):
在得出统一的先验(9)。假设Jeffreys先验且则得出
通常,建议使用贝叶斯公式(7)-(12)。当一些先验知识可用时,Basu等人(1996)建议使用信息先验(11)。由于不存在单一的最佳方法,因此建议您在分析之前复习文献,尤其是当较小时。
Bailey,RT(1997)。从零故障数据估计。风险分析,17,375-380。
Razzaghi,M。(2002)。关于样本中零出现的二项式成功概率的估计。 现代应用统计方法杂志,1(2),41。
Ludbrook,J.和Lew,MJ(2009)。估计罕见并发症的风险:“三个规则”是否足够好?ANZ外科杂志,79(7-8),565-570。
Eypasch,E.,Lefering,R.,Kum,CK和Troidl,H。(1995)。尚未发生的不良事件的可能性:统计提醒。 BMJ 311(7005):619–620。
Basu,美联社,Gaylor,DW和Chen,JJ(1996)。估计样本中零发生的罕见癌症的肿瘤发生概率。法规毒理学和药理学,23(2),139-144。
这类似于我在引入新的制造工艺以消除生产故障时遇到的问题。
新系统没有产生任何故障,因此人们一直在问同样的问题:我们如何预测故障率?在您的情况下,由于您已规定了可以发生故障的时间段,而无需担心该时间段内何时发生故障,因此消除了时间影响。这仅仅是某些事情是否失败的一种情况。有了规定-关于我的答案。
直观地,看来我们至少需要一个故障才能计算出故障率。但是,此假设中存在一个隐式错误。我们将永远不会计算失败率。那是因为我们正在处理一个样本。因此,我们只能估计可能的故障率范围。这样做的方法是找到故障率的分布。在这种情况下执行工作的分布是Beta分布,其中参数为:α = n + 1和β = N - n + 1
注意:N是样本量,n是失败次数(在您的情况下为0)
然后,您可以将该分布输入相应的二项式概率公式中,以获得一个单元失效概率的分布(可以通过分析或使用蒙特卡洛完成)。我怀疑这个数字会很低。
请注意,无论您的拳套中有多少次失败,此过程均适用。