最初是由于我们对模型对自然文本进行分类所做的一些工作而引起的,但是我已经对其进行了简化……也许太多了。
您有一辆蓝色的汽车(通过客观的科学测量-它是蓝色的)。
您将其显示给1000个人。
900说它是蓝色的。100不。
您将此信息提供给看不见汽车的人。他们只知道900个人说它是蓝色,而100个人则不是。您对这些人(千人)一无所知。
基于此,您问人:“汽车发蓝的概率是多少?”
这引起了我所问者之间的巨大分歧!如果有的话,正确的答案是什么?
最初是由于我们对模型对自然文本进行分类所做的一些工作而引起的,但是我已经对其进行了简化……也许太多了。
您有一辆蓝色的汽车(通过客观的科学测量-它是蓝色的)。
您将其显示给1000个人。
900说它是蓝色的。100不。
您将此信息提供给看不见汽车的人。他们只知道900个人说它是蓝色,而100个人则不是。您对这些人(千人)一无所知。
基于此,您问人:“汽车发蓝的概率是多少?”
这引起了我所问者之间的巨大分歧!如果有的话,正确的答案是什么?
Answers:
TL; DR:除非您认为人们在判断汽车颜色方面不合理,或者蓝色汽车罕见地稀有,否则在您的示例中,大量人员意味着汽车蓝色的可能性基本上为100%。
马修·德鲁里(Matthew Drury)已经给出了正确的答案,但我只是想通过一些数字示例加以补充,因为您选择的数字可以为各种不同的参数设置提供实际上非常相似的答案。例如,让我们假设,正如您在评论中说的那样,人们正确判断汽车颜色的概率为0.9。也就是说: 和
定义好之后,我们剩下要做的决定是:汽车是蓝色的先验概率是多少?让我们选择一个非常低的概率来看看会发生什么,然后说,即所有汽车中只有0.1%是蓝色。然后可以将汽车变成蓝色的后验概率计算为:
如果查看分母,则很明显,该总和中的第二项可以忽略不计,因为总和中各项的相对大小主要由到0.1 900的比率决定,该比率约为10 58。确实,如果您在计算机上进行此计算(注意避免数值下溢问题),您将得到等于1(在机器精度范围内)的答案。
先验概率在这里并不重要的原因是,因为您有太多证据证明一种可能性(汽车是蓝色)与另一种可能性。这可以通过似然比来量化,我们可以将其计算为:
因此,在考虑先验概率之前,有证据表明,从天文学角度来说,一种选择已经比另一种选择更可能发生,并且,在不作任何改变之前,蓝色汽车必须是无理的,愚蠢的(我们期望如此罕见)在地球上找到0辆蓝色汽车)。
那么,如果我们改变人们对汽车颜色的描述的准确性,该怎么办?当然,我们可以将其推到极致,并说他们只有50%的时间正确,这并不比掷硬币好。在这种情况下,汽车发蓝的后验概率等于先验概率,因为人们的回答没有告诉我们。但是可以肯定的是,人们至少比这要好一点,即使我们说人们只有51%的时间是准确的,但似然比仍然有效,因此汽车发蓝的可能性大约是倍。
这都是您在示例中选择的数量较大的结果。如果有9/10人说这辆车是蓝色的,那将是一个截然不同的故事,即使一个营地与另一个营地中有相同比例的人。因为统计证据并不取决于该比率,而是取决于相对派系之间的数字差异。实际上,在似然比(量化证据)中,说汽车不是蓝色的100个人正好抵消了说蓝色的900个人中的100个人,所以就好像您有800个人都同意它是蓝色的。这显然是非常明确的证据。
(编辑:正如Silverfish指出的那样,我在这里所做的假设实际上暗示着,每当一个人错误地描述一辆非蓝色的汽车时,他们都会默认说它是蓝色。这当然是不现实的,因为他们可以说出任何颜色,并且只会在某些时候说蓝色。但是,这与结论没有什么区别,因为人们将非蓝色汽车误认为蓝色汽车的可能性越小,则当他们说蓝色汽车的证据就越强因此,如果有的话,以上给出的数字实际上只是亲蓝证据的下限。)
正确答案取决于问题中未指定的信息,您将必须做出更多假设才能得出单个确定的答案:
因此,贝叶斯法则的两个应用程序将您带到了那里。您将需要根据有关特定情况的信息或进行一些合理的假设来确定未指定的参数。
您可以根据以下假设进行其他组合:
首先,您不了解这些事情。因此,您必须对其中的三个做出合理的假设,然后从那里确定第四个。
有一个重要的假设,即您的1000条意见不会有系统的偏见。这是一个合理的假设,但在其他情况下可能很重要。
例如:
在这种情况下不太可能,但是在其他情况下是一个重要的隐含假设。也不必那么极端-将您的问题转移到其他领域,这将是一个真正的因素。
答案可能受到共同偏见影响的每个例子:
不难想像一些结构上相同的问题,其中900:100的回答是对信念和诚实的衡量,或其他,并且没有指出正确的答案。在这种情况下不太可能,但在其他情况下-是的。
您从不同的人那里得到不同答案的原因之一是,可以用不同的方式来解释问题,并且不清楚此处的“概率”是什么意思。理解问题的一种方法是使用马修答案中的贝叶斯规则分配先验和推理。
在询问概率之前,您必须确定将什么建模为随机模型,将哪些模型为非随机模型。未知但固定数量的物体应优先分配,这并不是普遍接受的。这是一个与您类似的实验,着重说明了问题所在:
the probability is either one or zero, depending on whether the car is actually blue or not.
据我所知,这与对“概率”的理解不符。听起来有点像“ X可能发生或不可能发生,因此概率必须为50%”。您能否更清楚地说明该句子的意思?
根据您的假设,概率很容易在0%到100%之间变化
尽管我真的很喜欢现有的答案,但实际上,基本上可以归结为以下两种简单情况:
在这种情况下,有很多人说这辆车不是蓝色的,所以这辆车实际上不是蓝色的可能性很小。因此,概率接近0%。
在这种情况下,有很多人说这辆车是蓝色的,很可能确实是蓝色的。因此,概率接近100%。
当然,从数学的角度出发,您会从类似“让我们假设相关概率为...”之类的通用词开始,这是毫无意义的,因为此类情况通常在任何随机情况下都不为人所知。因此,我主张着眼于极端,以把握这样的思想:两个百分比都可以通过简单而现实的假设轻松地证明其合理性,因此,没有一个有意义的答案。
您需要开发一些估计框架。您可能会问的一些问题是
有多少种颜色?我们在说两种颜色吗?还是彩虹的所有颜色?
颜色有多鲜明?我们在说蓝色和橙色吗?还是蓝色,青色和绿松石色?
变蓝意味着什么?是青色和/或绿松石蓝色吗?还是蓝色本身?
这些人在估计颜色方面有多好?他们都是平面设计师吗?还是他们色盲?
从纯粹的统计角度来看,我们可以对最后一个做出一些猜测。首先,我们知道至少有10%的人选择了错误的答案。如果只有两种颜色(来自第一个问题),那么我们可以说存在
Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%
快速检查一下,如果将它们加在一起,我们将得到100%。您可以在@MatthewDrury答案中看到更多的数学符号。
我们如何获得第三者的90%?有多少人说蓝色,但不是。因为只有两种颜色,所以它们是对称的。如果存在两种以上的颜色,那么当他们说别的东西的时候,错误选择的机会就是蓝色。
无论如何,这种估算方法使我们得到了90%的蓝色。其中包括81%的人说蓝色的机会和9%的人说不是蓝色的机会。这可能是我们最能回答原始问题的方法,它要求我们依靠数据来估计两个不同的事物。并假设选择蓝色的几率与选择蓝色的几率相同。
如果有两种以上的颜色,那么逻辑将有所改变。前两行保持不变,但在后两行中我们失去了对称性。在这种情况下,我们需要更多的投入。可以想象,我们可能会再次估计正确地将蓝色表示为81%的机会,但是我们不知道当有人说不是时,蓝色的可能性是多少。
我们甚至还可以改进两种颜色的估计。给定统计上每种颜色的汽车的数量,我们可以统计出大量的人对它们进行查看和分类。然后,我们可以计算出人们在做出每种颜色选择时正确的频率以及对每种颜色选择正确的频率。然后,根据人们的实际选择,我们可以更准确地估算。
您可能会问90%可能是错的。考虑一下如果有三种颜色会发生什么:天蓝色,蓝色和蓝宝石。有人可能会合理地认为所有这三个都是蓝色的。但是我们想要更多。我们想要确切的阴影。但是谁记得其他阴影的名称呢?许多人可能会猜到蓝色,因为它是他们知道的唯一匹配的阴影。而且当它变成天蓝色时仍然是错误的。
一个精确的,数学的,真/假的概率不能计算与你提供的信息。
但是,在现实生活中,此类信息永远无法确定。因此,按照我们的直觉(如果我们下注,我所有的钱都将流到哪里),那辆车肯定是蓝色的。(有些人认为这不再是统计数据了,但是,科学的黑白观点不是很有用)
推理很简单。假设汽车不是蓝色的。然后90%的人(!)错了。它们可能仅是错误的,原因是存在以下一系列问题:
由于上述情况显然不会影响90%的平均随机人口(例如色盲影响大约8%的男性和0.6%的女性,即1000人中有43人),因此汽车一定是蓝色。(那是我所有的钱都会去的)。
被调查者对于为准确回答问题而进行的民意调查知之甚少。就他而言,民意调查可能会遇到几个问题:
参加民意测验的人可能会有偏见:
由于某种原因,汽车的颜色难以观察,在此之前,人们出于某种原因向人们展示了很多蓝色的汽车,因此大多数人都认为这辆汽车也可能是蓝色的。
您付钱给他们是说汽车是蓝色的。
您有人催眠了所有人,使他们相信这辆车是蓝色的。
他们订立了一项谎言来破坏民意测验。
参加投票的人之间可能存在相关性,这是由于他们的选择方式或彼此之间的影响:
您不小心在群众大会上对具有相同色盲的人进行了调查。
您在幼儿园进行了调查;女孩们对这辆车不感兴趣,大多数男孩子都把蓝色当做自己喜欢的颜色,使他们想象这辆车是蓝色的。
看到汽车的第一个人醉了,以为它看上去是蓝色的,大喊“ IT IS BLUE”,影响其他所有人以为汽车是蓝色的。
因此,尽管如果完全正确地进行了民意调查,则汽车发蓝的可能性非常高(如鲁宾·范·伯根的回答中所述),但民意调查的可靠性可能已经受到损害,这使得汽车发蓝的可能性不大。微不足道。被调查者估计这次机会最终有多大,取决于他对情况在民意测验中被搞砸的可能性以及您进行民意测验的能力(以及他认为自己的调皮程度)的估计。
不同的文化和语言具有不同的蓝色概念。IIRC,一些文化在蓝色的概念中包括绿色!
像任何自然语言单词一样,您只能假定在何时(和何时不)将事物称为“蓝色”有一定的文化习惯。
总体而言,语言中的颜色令人惊讶地主观(来自以下评论的链接,感谢@Count Ibilis)
根据更精确的前提条件,可能性可能是几个不同的值,但是99.995%对我来说最有意义。
根据定义,我们知道这辆车是蓝色的(100%),但是并没有明确说明这实际上意味着什么(这在某种程度上是哲学上的)。我会假设某种东西是蓝色的,实际上可以看作是蓝色。
我们也知道90%的测试对象将其报告为蓝色。
我们不知道被问了什么或如何进行评估,以及汽车在什么照明条件下。被要求命名颜色时,一些受试者可能由于照明条件而说“绿蓝色”,而评估者可能还不算是“蓝色”。如果问题是“这是蓝色吗?”,同一个人可能会回答“是”。我将假设您不打算恶意欺骗您的测试对象。
我们知道,tritanopy的发生率约为0,005%,这意味着如果汽车实际上可以看成蓝色,那么99.995%的测试对象确实看到了蓝色。但是,这意味着9.995%的测试对象在清楚地看到蓝色时没有报告蓝色。他们在撒谎。这也与您的生活经历告诉您的非常接近:人们并不总是诚实的(但是,除非有动机,他们通常都是诚实的)。
因此,非观察者可以以绝对的信心认为汽车是蓝色的。那将是100%
除了……除非非观察者本人患有三角虫病,否则即使其他所有人(或更确切地说,其中90%的人)都这样说,她也不会将汽车视为蓝色。在这里,它又重新成为一种哲学:如果其他人都听到一棵树倒下了,但我没有,那棵树倒下了吗?
我敢说最合理,最实用的答案是:如果非观察者恰巧是三足动物(0.005%的机会),那么验证预测的颜色和所见的真实颜色是否相同将产生错误。因此,可能性为99.995%,而不是100%。
此外,作为奖励,因为我们发现9.995%的测试对象是骗子,而且众所周知所有克里特岛人都是骗子,所以可以得出结论,我们不在克里特岛!
您有一辆蓝色的汽车(通过客观的科学测量-它是蓝色的)。
...
“汽车发蓝的概率是多少?”
它是100%蓝色的。
他们只知道900个人说它是蓝色,而100个人则不是。您对这些人(千人)一无所知。
使用这些数字(没有任何上下文)完全是胡说八道。一切都归结为对问题的个人解释。我们不应该走这条路,而要使用维特根斯坦的著作:“沃夫人尼克·斯普雷琴·坎恩,达鲁伯·穆斯·施威根。”
想象以下问题进行比较:
All they know is that 0 people said it was blue, and 0 did not.
You know nothing more about these people (the 0).
这基本上是相同的(信息较少)问题,但是更清楚的是,我们对汽车颜色的看法主要是(如果不是完全的话)情况。
从长远来看,当我们获得多个相关问题时,便能够开始猜测这些不完整问题的答案。这适用于针锋相对的算法,在单个情况下不起作用,但从长远来看确实有效。同样,维特根斯坦(Wittgenstein)从他的早期调查工作和《首席调查官》中回来了。我们能够回答这些问题,但是我们需要更多信息/试验/问题。这是一个过程。
如果我们假设汽车是蓝色的,那么千分之100的人说它不是蓝色就意味着某种极端的样本偏差。也许您只在色盲人群中采样。如果我们假设汽车不是蓝色的,那么样本偏差会更糟。因此,我们可以从给定的数据得出的结论是,样本非常有偏差,并且由于我们不知道其偏差程度,因此无法得出有关汽车颜色的任何结论。
有一些答案。我绝对不是数学大师,但是,这是我的。
只能有4种可能性:
case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect
从问题中可以看出,案例1和案例4的总和为900人(90%),案例2和案例3的总和为100人(10%)。但是这里有个问题:您不知道这两个案例对中的分布。可能情况1和情况4的总和完全由情况1(这意味着汽车是蓝色)组成,或者可能全部由情况4(这意味着汽车不是蓝色)组成。情况2 + 3的总和也是如此。所以...您需要提供某种方法来预测案件总数内的分布。问题中没有其他指示(没有地方说人们80%知道他们的颜色或类似的东西),您不可能拿出一个确定的答案。
话虽如此...我确实怀疑预期的答案可能与以下内容类似:
P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4 + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case 3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%
如果仅剩下未知的50%,则将其称为误差容限。