概率误差条有什么意义吗?


25

人们经常说某个事件发生的可能性为50-60%。有时我什至会看到人们对概率分配给出明确的误差线。这些陈述是否具有任何意义,或者仅仅是出于语言上的不适而又为固有不可知的事物选择了特定的数字?


1
计算学习理论中的“可能近似正确”框架不是这样做的吗,通常会给以概率成立的分类器的错误率?如果这是一个毫无意义的概念,我怀疑那些(非常聪明的)CoLT人员是否会发现它!1δ
Dikran有袋动物

5
@DikranMarsupial PAC学习中的错误不在于概率本身(这个问题要问的)上,而在于数据上。也就是说,如果我们可以证明概率为,则我们将算法的输出称为“近似正确” ,则答案在真实值的范围内。1δε
离散蜥蜴

@Discretelizard,但是在分类设置中,这不是错误率(错误率)的限制吗?自从我看了CoLT很久了!
Dikran有袋动物

1
@DikranMarsupial在PAC学习的常规设置中,“近似”部分衡量错误的“幅度”,而不是“可能性”。PAC界限的动机是获得比预期风险更多的细粒度分析。我认为分类设置不会发生这种变化,尽管为了使PAC有意义,必须在类之间定义一个“距离”(或损失函数)。(在二进制分类的更特殊情况下,只有一种产生错误的方法,因此在这种情况下近似部分没有意义)
离散蜥蜴

Answers:


36

如果您谈论的是已知概率,那是没有意义的,例如,对于普通硬币,根据定义,抛头的概率为0.5。但是,除非您在谈论教科书示例,否则永远不会知道确切的概率,我们只会大致了解它。

不同的是,当您从数据中估计概率时,例如,您在购买的12563张彩票中观察到13张中奖彩票,因此从此数据中,您估计的概率为13/12563。这是您根据样本估算得出的值,因此不确定,因为使用不同的样本,您可能会观察到不同的值。不确定性估计与概率无关,而是与估计有关。

另一个例子是概率不是固定的,而是取决于其他因素。假设我们正在谈论车祸中死亡的可能性。我们可以考虑“全局”概率,即在直接和间接导致车祸的所有因素上被边缘化的单一值。另一方面,考虑到风险因素,您可以考虑概率在人群之间的变化。

您可以找到更多示例,其中概率本身被视为随机变量,因此它们变化而不是固定。


1
如果通过类似Logistic回归的方法来完成概率估计的计算,那么假设这些“误差线”是指预测间隔就不是很自然吗?(我问我主要是为澄清的第一点你养,显然+1)
usεr11852说恢复单胞菌

1
@ us11r11852置信区间,预测区间,最高密度区域等,具体取决于实际情况。我回答的范围很广,因为在许多情况下我们的概率都是“可变的”,并且它们以不同的方式变化。您也可以在不同的情况下对它们进行不同的解释。
蒂姆

1
对于很小的误差线,即使是“已知”概率也可能是速记。可以推测出,如果进行了足够多的试验才能获得足够小的误差条,而排除50.00000%,则硬币翻转可能是50.00001%-49.99999%。没有任何物理定律表明即使对于非对称硬币,赔率也应该精确,但是误差线太小了,任何人都无法关心。
核王

5
@NuclearWang,这是由OP使用“公平硬币”这一短语解释的。根据定义,公平硬币的P(HEADS)为0.5。公平的硬币是一种数学构造。我建议进行编辑,以“按定义”代替“按物理定律”以强调这一点。
De Novo

2
@DeNovo同样适用于实物硬币stat.columbia.edu/~gelman/research/published/diceRev2.pdf,但是是的,我说“公平”,不要开始讨论
Tim

23

xkcd中最相关的插图

在此处输入图片说明

带有相关标题:

...影响大小为1.68(95%CI:1.56(95%CI:1.52(95%CI:1.504)(95%CI:1.494(95%CI:1.488(95%CI:1.485(95%CI:1.482) (95%CI:1.481(95%CI:1.4799(95%CI:1.4791(95%CI:1.4784 ...


这是否意味着概率的误差线是多余的?
BalinKingOfMoria

12
开个玩笑,这意味着误差棒的精度是不确定的,并且在无限回归中不确定性的评估本身是不确定的。
西安

7
这就是为什么我认为这幅图是相关的,并且与评估统计误差的基本困难(和美丽的挑战)紧密相关。
西安

14
该图说明了元不确定性,它可能与概率的不确定性有关,因为不确定性本身是对概率分布宽度的度量,但是您的帖子没有任何解释。实际上,XKCD漫画暗示它与错误传播有关(这是错误的),而问题与事实无关。
格里特

6

我知道两种解释。蒂姆说过第一个:我们已经从Y次试验中观察到X成功,因此,如果我们认为试验是成功的,我们可以估计X / Y过程的概率,并带有一些误差线,例如1 / 阶。YX/Y1/Y

第二个问题涉及“高阶概率”或有关生成过程的不确定性。例如,假设我手里有一个由精巧的赌徒制造的硬币,他以0.5概率制造了60%的正面硬币,而以0.5概率制造了40%的正面硬币。我最好的猜测是硬币正面朝上的可能性为50%,但误差线很大:“真实”的可能性为40%或60%。

换句话说,您可以想象运行10亿次实验并获得成功分数X/Y(实际上是极限分数)。至少从贝叶斯角度来看,在该数字周围给出例如95%的置信区间是有意义的。在上面的例子中,给定当前的知识,这是[0.4,0.6]。对于一个真正的硬币,也许这是[0.47,0.53]什么的。有关更多信息,请参见:

我们是否需要高阶概率?如果是,它们是什么意思?犹太珍珠。UAI 1987 https://arxiv.org/abs/1304.2716


4

所有测量均不确定。

因此,对概率的任何度量也是不确定的。

概率测量的不确定性可以用不确定性条直观地表示。注意,不确定度条通常被称为误差条。这是不正确的或至少具有误导性的,因为它显示不确定性而不是错误(错误是度量与未知真值之间的差异,因此该错误是未知的;不确定性是对取值后概率密度的宽度的度量。测量)。

一个相关的主题是元不确定性。不确定性描述了后验概率分布函数的宽度,在A型不确定性(通过重复测量估算不确定性)的情况下,不可避免地存在不确定性。计量学家告诉我,在这种情况下,计量实践要求扩大不确定性(IIRC,如果不确定性是由N次重复测量的标准偏差估算的,则应将所得标准偏差乘以NN2),本质上是一个亚不确定性。


3

prob(A|Θ=θ,I)IΘ=θ0prob(Θ=θ|I)=δθθ0

prob(A|I)=θprob(A|Θ=θ,I)δθθ0=prob(A|Θ=θ0,I)

ΘIprob(Θ=θ|I)prob(A|I)AΘ=θΘA

prob(A,Θ=θ|I)=prob(A|Θ=θ,I)prob(Θ=θ|I)prob(A|I)=θprob(A|Θ=θ,I)prob(Θ=θ|I)

因此,在概率上添加误差线类似于在干扰参数上添加不确定性,后者可以修改概率,但不能使其变得不确定。


1

在很多情况下,您希望有一个概率。假设您从事食品安全工作,并使用生存分析模型来估计肉毒杆菌孢子萌发(从而产生致命毒素)的可能性与食物制备步骤(即烹饪)和孵化时间/温度(参见)。然后,食品生产者可能希望使用该模型来设置安全的“使用期限”,以便使消费者食用肉毒杆菌的风险适当降低。但是,该模型适合有限的训练样本,因此,与其选择发芽概率小于0.001的使用日期,不如选择一个较早的日期(考虑到建模假设)您可以确定95%的发芽概率小于0.001。在贝叶斯环境中,这似乎是很自然的事情。


0

TL;博士 - 的任何一次性猜测从特定猜测器可以减少到单一的概率。但是,这只是微不足道的情况。只要存在某种上下文相关性,而不仅仅是单个概率,则概率结构才有意义。


随机硬币落在正面上的机会是50%。

不管是不是硬币,都没关系;至少不是我 因为虽然硬币可能会有偏差,但有经验的观察员可能会使用该偏差做出更明智的预测,但我不得不猜测50%的几率。

HeadsTails50%50%.
First flipSecondflipHeadsTailsHeads25%25%Tails25%25%,
Same sidetwiceHeadsand Tails50%50%.

PHeads,

HeadsTailsPHeads1PHeads.
First flipSecondflipHeadsTailsHeadsPHeads2PHeads(1PHeads)TailsPHeads(1PHeads)(1PHeads)2,
Same sidetwiceHeadsand Tails12PHeads(1PHeads)2PHeads(1PHeads).
PHeads,50 因此看来这将减少到之前的表格中。

所以是同一回事,对吧?

事实证明,除非是一枚非常公平的硬币的特殊情况,否则获得两个正面或反面的几率总是大于获得两个正面或反面的可能性。因此,如果您确实减少了表格,并假设概率本身捕获了不确定性,则扩展时的预测将是荒谬的。

也就是说,没有“ 真正的 ”硬币翻转。我们可能有各种不同的翻转方法,它们可能会产生非常不同的结果和明显的偏差。因此,有一个一致的价值的想法P 当我们基于该前提构造参数时,也会导致错误。

因此,如果有人问我抛硬币的几率,我不会说 ''50尽管这是我最好的猜测。相反,我可能会说''大概关于 50

我想说的大致是:

如果我必须做一个一次性的猜测,我大概会 50 但是,还有其他情况,您可能应要求我澄清它是否重要。


人们经常说某个事件发生的可能性为50-60%。

如果您与他们坐下来并计算出他们的所有数据,模型等,则可能能够生成更好的数字,或者理想情况下,可以生成更好的模型来更可靠地捕获他们的预测能力。

但是,如果您将差额拆分为55%,那就像在假设 P=50因为在将高阶部分截断后,基本上可以快速估算一下。一次性快速估算不一定是一个坏策略,但确实会损失一些东西。


0

我认为只有误差线很重要,但是在给定的示例中,整个事情可能几乎毫无意义。
该示例将自己解释为置信区间,其中一定程度的确定性上下限是概率范围。建议的答案将处理该解释。多数来源-https: //www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U


该示例表明,在给定的置信度下,答案不太可能高于60%,同样不太可能低于50%。这对一组数字非常方便,以至于类似于“合并”,其中55%的赃物进一步陷入了+/- 5%的范围。熟悉的舍入数字是立即可疑的。
达到置信区间的一种方法是,确定所选的置信度(假设为90%),并且我们允许该结果可能低于或高于我们的估计,但只有10%的机会“正确”的答案超出了我们的时间范围。因此,我们估计一个较高的界限,以使“正确答案只有一个1/20的机会大于此上限”,并且对下限进行类似的操作。这可以通过“校准估计”来完成,它是一种测量形式,也可以是其他形式的测量。
无论如何,关键是A)从一开始就承认存在与我们的不确定性相关的不确定性,B)避免将我们的手扔在那东西上,称其为一团糟,只是简单地在上下浮动5%。这样做的好处是,严格选择程度的方法可以产生仍在数学上仍然相关的结果,其结果可以用数学方式表述:“正确答案在这两个界限之间的可能性为90%...”是正确形成的置信区间(CI),可以在以后的计算中使用。
此外,通过增强置信度,我们可以通过比较预测值与结果并根据发现的结果来改进估计方法,来校正用于得出估计值的方法。没有什么可以使事情完美,但是可以使许多事情达到90%有效。
请注意,90%CI与OP中给出的示例包含10%的字段并忽略90%的事实无关。波音747-100在90%CI
的翼展是多少?好吧,我有95%的确信它不超过300英尺,而且我同样有把握的是它不少于200英尺。所以,从我的头顶上,我会给您90%的CI(200) -235英尺。
注意,没有“中央”估计。配置项不是由猜测加软糖因素形成的。这就是为什么我说误差线可能比给定的估计值更重要。


就是说,间隔估计(上面的所有内容)不一定比带有正确计算的误差的点估计(这在我这一点上已经超出了我的记忆范围,我只记得它经常做得不正确)。我只是说,许多以范围表示的估计-而且我敢说大多数带有整数的范围-是点+错误,而不是区间或点+误差估计。


一个正确使用点+错误的:

“一台机器将杯子装满液体,并且应该进行调整,以使杯子的液体含量为250克。由于该机器无法准确地向每个杯子装满250.0克杯子,因此添加到各个杯子中的内容会有所不同,并假定为随机变量X。假定此变化正态分布在期望的平均值250 g周围,标准偏差σ为2.5 g。为确定机器是否经过充分校准,样本n = 25随机选择几杯液体,然后称量杯子的重量。测得的液体质量为X1,...,X25,是X的随机样本。”

关键点:在此示例中,均指定/假设均值和误差,而不是估计/衡量均值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.