在讨论任务完成率时,是否有办法表明20次尝试中的0次比10次尝试中的0次更“糟糕”?
在讨论任务完成率时,是否有办法表明20次尝试中的0次比10次尝试中的0次更“糟糕”?
Answers:
假设我们知道一次尝试成功的可能性。在这种情况下,我们计算出10个案例中的0个概率和20个案例中的0个概率。
但是,在这种情况下,我们走了另一条路。我们不知道概率,我们有数据,我们试图估计概率。
我们拥有的案例越多,我们对结果的把握就越大。如果我将一枚硬币掷向正面,您将无法确定它是双向的。如果我将它扔1000次并且全神贯注,它就不太可能保持平衡。
设计了一些方法,以便在给出估计时考虑路径数。其中之一是@abukaj在上面评论的加性平滑。在加法平滑中,我们添加了额外的伪样本。在我们的案例中,我们看到的是在路径上添加了另外两个-一个成功和一个失败。
注意,加法平滑仅仅是一种估计方法。使用不同的方法,您将获得不同的结果。即使使用加法平滑本身,如果添加4个伪样本,您也会得到不同的结果。
另一种方法是使用@mdewey建议的置信区间。我们拥有的样本越多,置信区间将越短。置信区间的大小与样本的平方根成正比-。因此,将样本数量加倍将导致较短的置信区间。 √
两种情况下的均值为0。我们采用90%的置信度(z = 1.645)
如果缺少数据,则存在不确定性。您所做的假设和将使用的外部数据将改变您将获得的收益。
扩展了调用置信区间的概念,这里有一个精确的二项式区间的概念。
二项式分布是在独立试验中成功总数为0(失败)或1(成功)的分布。传统上将获得1(成功)的概率表示为,其补码为。则标准概率结果是,在试验中恰好有成功的概率为q = 1 − p k n
置信区间的概念是结合一组模型参数的可能值(在这里,成功的概率),这样我们就可以使概率(当然,频率论)关于真实参数值是否在此区间内的语句(即,如果我们重复进行10或20次试验的概率实验,并以指定的方式构建置信区间,则会观察到参数的真实值在95%的时间间隔内。
在这种情况下,我们可以在该公式中求解: p n ,0 = (1 − p )n
因此,如果我们想要一个95%的单边间隔,我们可以设置来解决观察到的零计数最多为5%的可能性。对于,答案为(即,在极端情况下,如果每个试验中成功的概率为13.9%,那么观察到零成功的概率为5%)。对于,答案是。因此,从的样本中,我们比从的样本中学到的更多,因为我们可以``排除''的样本的范围仍然显得合理。