人们经常说某个事件发生的可能性为50-60%。有时我什至会看到人们对概率分配给出明确的误差线。这些陈述是否具有任何意义,或者仅仅是出于语言上的不适而又为固有不可知的事物选择了特定的数字?
人们经常说某个事件发生的可能性为50-60%。有时我什至会看到人们对概率分配给出明确的误差线。这些陈述是否具有任何意义,或者仅仅是出于语言上的不适而又为固有不可知的事物选择了特定的数字?
Answers:
如果您谈论的是已知概率,那是没有意义的,例如,对于普通硬币,根据定义,抛头的概率为0.5。但是,除非您在谈论教科书示例,否则永远不会知道确切的概率,我们只会大致了解它。
不同的是,当您从数据中估计概率时,例如,您在购买的12563张彩票中观察到13张中奖彩票,因此从此数据中,您估计的概率为13/12563。这是您根据样本估算得出的值,因此不确定,因为使用不同的样本,您可能会观察到不同的值。不确定性估计与概率无关,而是与估计有关。
另一个例子是概率不是固定的,而是取决于其他因素。假设我们正在谈论车祸中死亡的可能性。我们可以考虑“全局”概率,即在直接和间接导致车祸的所有因素上被边缘化的单一值。另一方面,考虑到风险因素,您可以考虑概率在人群之间的变化。
您可以找到更多示例,其中概率本身被视为随机变量,因此它们变化而不是固定。
带有相关标题:
...影响大小为1.68(95%CI:1.56(95%CI:1.52(95%CI:1.504)(95%CI:1.494(95%CI:1.488(95%CI:1.485(95%CI:1.482) (95%CI:1.481(95%CI:1.4799(95%CI:1.4791(95%CI:1.4784 ...
我知道两种解释。蒂姆说过第一个:我们已经从Y次试验中观察到成功,因此,如果我们认为试验是成功的,我们可以估计X / Y过程的概率,并带有一些误差线,例如1 / √阶。。
第二个问题涉及“高阶概率”或有关生成过程的不确定性。例如,假设我手里有一个由精巧的赌徒制造的硬币,他以概率制造了60%的正面硬币,而以概率制造了40%的正面硬币。我最好的猜测是硬币正面朝上的可能性为50%,但误差线很大:“真实”的可能性为40%或60%。
换句话说,您可以想象运行10亿次实验并获得成功分数(实际上是极限分数)。至少从贝叶斯角度来看,在该数字周围给出例如95%的置信区间是有意义的。在上面的例子中,给定当前的知识,这是。对于一个真正的硬币,也许这是什么的。有关更多信息,请参见:
我们是否需要高阶概率?如果是,它们是什么意思?犹太珍珠。UAI 1987 https://arxiv.org/abs/1304.2716
所有测量均不确定。
因此,对概率的任何度量也是不确定的。
概率测量的不确定性可以用不确定性条直观地表示。注意,不确定度条通常被称为误差条。这是不正确的或至少具有误导性的,因为它显示不确定性而不是错误(错误是度量与未知真值之间的差异,因此该错误是未知的;不确定性是对取值后概率密度的宽度的度量。测量)。
一个相关的主题是元不确定性。不确定性描述了后验概率分布函数的宽度,在A型不确定性(通过重复测量估算不确定性)的情况下,不可避免地存在不确定性。计量学家告诉我,在这种情况下,计量实践要求扩大不确定性(IIRC,如果不确定性是由N次重复测量的标准偏差估算的,则应将所得标准偏差乘以),本质上是一个亚不确定性。
因此,在概率上添加误差线类似于在干扰参数上添加不确定性,后者可以修改概率,但不能使其变得不确定。
TL;博士 - 的任何一次性猜测从特定猜测器可以减少到单一的概率。但是,这只是微不足道的情况。只要存在某种上下文相关性,而不仅仅是单个概率,则概率结构才有意义。
随机硬币落在正面上的机会是50%。
不管是不是硬币,都没关系;至少不是我 因为虽然硬币可能会有偏差,但有经验的观察员可能会使用该偏差做出更明智的预测,但我不得不猜测50%的几率。
所以是同一回事,对吧?
事实证明,除非是一枚非常公平的硬币的特殊情况,否则获得两个正面或反面的几率总是大于获得两个正面或反面的可能性。因此,如果您确实减少了表格,并假设概率本身捕获了不确定性,则扩展时的预测将是荒谬的。
也就是说,没有“ 真正的 ”硬币翻转。我们可能有各种不同的翻转方法,它们可能会产生非常不同的结果和明显的偏差。因此,有一个一致的价值的想法 当我们基于该前提构造参数时,也会导致错误。
因此,如果有人问我抛硬币的几率,我不会说 尽管这是我最好的猜测。相反,我可能会说
我想说的大致是:
如果我必须做一个一次性的猜测,我大概会 但是,还有其他情况,您可能应要求我澄清它是否重要。
人们经常说某个事件发生的可能性为50-60%。
如果您与他们坐下来并计算出他们的所有数据,模型等,则可能能够生成更好的数字,或者理想情况下,可以生成更好的模型来更可靠地捕获他们的预测能力。
但是,如果您将差额拆分为55%,那就像在假设 因为在将高阶部分截断后,基本上可以快速估算一下。一次性快速估算不一定是一个坏策略,但确实会损失一些东西。
我认为只有误差线很重要,但是在给定的示例中,整个事情可能几乎毫无意义。
该示例将自己解释为置信区间,其中一定程度的确定性上下限是概率范围。建议的答案将处理该解释。多数来源-https: //www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U
该示例表明,在给定的置信度下,答案不太可能高于60%,同样不太可能低于50%。这对一组数字非常方便,以至于类似于“合并”,其中55%的赃物进一步陷入了+/- 5%的范围。熟悉的舍入数字是立即可疑的。
达到置信区间的一种方法是,确定所选的置信度(假设为90%),并且我们允许该结果可能低于或高于我们的估计,但只有10%的机会“正确”的答案超出了我们的时间范围。因此,我们估计一个较高的界限,以使“正确答案只有一个1/20的机会大于此上限”,并且对下限进行类似的操作。这可以通过“校准估计”来完成,它是一种测量形式,也可以是其他形式的测量。
无论如何,关键是A)从一开始就承认存在与我们的不确定性相关的不确定性,B)避免将我们的手扔在那东西上,称其为一团糟,只是简单地在上下浮动5%。这样做的好处是,严格选择程度的方法可以产生仍在数学上仍然相关的结果,其结果可以用数学方式表述:“正确答案在这两个界限之间的可能性为90%...”是正确形成的置信区间(CI),可以在以后的计算中使用。
此外,通过增强置信度,我们可以通过比较预测值与结果并根据发现的结果来改进估计方法,来校正用于得出估计值的方法。没有什么可以使事情完美,但是可以使许多事情达到90%有效。
请注意,90%CI与OP中给出的示例包含10%的字段并忽略90%的事实无关。波音747-100在90%CI
的翼展是多少?好吧,我有95%的确信它不超过300英尺,而且我同样有把握的是它不少于200英尺。所以,从我的头顶上,我会给您90%的CI(200) -235英尺。
注意,没有“中央”估计。配置项不是由猜测加软糖因素形成的。这就是为什么我说误差线可能比给定的估计值更重要。
就是说,间隔估计(上面的所有内容)不一定比带有正确计算的误差的点估计好(这在我这一点上已经超出了我的记忆范围,我只记得它经常做得不正确)。我只是说,许多以范围表示的估计-而且我敢说大多数带有整数的范围-是点+错误,而不是区间或点+误差估计。
一个正确使用点+错误的:
“一台机器将杯子装满液体,并且应该进行调整,以使杯子的液体含量为250克。由于该机器无法准确地向每个杯子装满250.0克杯子,因此添加到各个杯子中的内容会有所不同,并假定为随机变量X。假定此变化正态分布在期望的平均值250 g周围,标准偏差σ为2.5 g。为确定机器是否经过充分校准,样本n = 25随机选择几杯液体,然后称量杯子的重量。测得的液体质量为X1,...,X25,是X的随机样本。”
关键点:在此示例中,均指定/假设均值和误差,而不是估计/衡量均值。