114

最初是由于我们对模型对自然文本进行分类所做的一些工作而引起的，但是我已经对其进行了简化……也许太多了。

您有一辆蓝色的汽车（通过客观的科学测量-它是蓝色的）。

您将其显示给1000个人。

900说它是蓝色的。100不。

您将此信息提供给看不见汽车的人。他们只知道900个人说它是蓝色，而100个人则不是。您对这些人（千人）一无所知。

基于此，您问人：“汽车发蓝的概率是多少？”

这引起了我所问者之间的巨大分歧！如果有的话，正确的答案是什么？

probability

— 帕特·莫洛伊
source

162

我想知道，如果你改变的答案会是什么车来装扮。

— user1717828

13

那么人们的问题是什么呢？“汽车是蓝色的吗？” 或“汽车是什么颜色？”

— kon psych

13

汽车变蓝意味着什么？如果有人说汽车不是蓝色，则可能是有人将其称为蓝色，而另一些人将其称为不同的颜色。这并不意味着他们不同意颜色，而是意味着他们不同意颜色的名称。

— 奔

7

我认为，如果您给出遇到的不同意见，这个问题将会大大改善。从目前的角度来看，答案只能探索整个领域，从概率论到色彩理论甚至是生物学（色盲），我看不出这对您有什么帮助。

— AnoE

32

问题描述中缺少某些内容。当很多人否认汽车是蓝色时，有100个人否认这辆汽车是蓝色的，您不能简单地将它们作为随机错误丢弃。

— 阿克萨卡尔州

117

TL; DR：除非您认为人们在判断汽车颜色方面不合理，或者蓝色汽车罕见地稀有，否则在您的示例中，大量人员意味着汽车蓝色的可能性基本上为100％。

马修·德鲁里（Matthew Drury）已经给出了正确的答案，但我只是想通过一些数字示例加以补充，因为您选择的数字可以为各种不同的参数设置提供实际上非常相似的答案。例如，让我们假设，正如您在评论中说的那样，人们正确判断汽车颜色的概率为0.9。也就是说：和

p (say it's blue | car is blue) = 0.9 = 1 - p (say it isn't blue | car is blue)

$p(\text{say it's blue}|\text{car is blue})=0.9=1-p(\text{say it isn't blue}|\text{car is blue})$

p (say it isn't blue | car isn't blue) = 0.9 = 1 - p (say it is blue | car isn't blue)

$p(\text{say it isn't blue}|\text{car isn't blue})=0.9=1-p(\text{say it is blue}|\text{car isn't blue})$

定义好之后，我们剩下要做的决定是：汽车是蓝色的先验概率是多少？让我们选择一个非常低的概率来看看会发生什么，然后说，即所有汽车中只有0.1％是蓝色。然后可以将汽车变成蓝色的后验概率计算为： $p(\text{car is blue})=0.001$

\begin{aligned} p (car is blue | answers) \\ = \frac{p (answers | car is blue) p (car is blue)}{p (answers | car is blue) p (car is blue) + p (answers | car isn't blue) p (car isn't blue)} \\ = \frac{{0.9}^{900} \times {0.1}^{100} \times 0.001}{{0.9}^{900} \times {0.1}^{100} \times 0.001 + {0.1}^{900} \times {0.9}^{100} \times 0.999} \end{aligned}

$\begin{align*} &p(\text{car is blue}|\text{answers})\\ &=\frac{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})}{p(\text{answers}|\text{car is blue})\,p(\text{car is blue})+p(\text{answers}|\text{car isn't blue})\,p(\text{car isn't blue})}\\ &=\frac{0.9^{900}\times 0.1^{100}\times0.001}{0.9^{900}\times 0.1^{100}\times0.001+0.1^{900}\times0.9^{100}\times0.999} \end{align*}$

如果查看分母，则很明显，该总和中的第二项可以忽略不计，因为总和中各项的相对大小主要由到的比率决定，该比率约为。确实，如果您在计算机上进行此计算（注意避免数值下溢问题），您将得到等于1（在机器精度范围内）的答案。 $0.9^{900}$ $0.1^{900}$ $10^{58}$

先验概率在这里并不重要的原因是，因为您有太多证据证明一种可能性（汽车是蓝色）与另一种可能性。这可以通过似然比来量化，我们可以将其计算为：

\frac{p (answers | car is blue)}{p (answers | car isn't blue)} = \frac{{0.9}^{900} \times {0.1}^{100}}{{0.1}^{900} \times {0.9}^{100}} \approx 10^{763}

$\frac{p(\text{answers}|\text{car is blue})}{p(\text{answers}|\text{car isn't blue})}=\frac{0.9^{900}\times 0.1^{100}}{0.1^{900}\times 0.9^{100}}\approx 10^{763}$

因此，在考虑先验概率之前，有证据表明，从天文学角度来说，一种选择已经比另一种选择更可能发生，并且，在不作任何改变之前，蓝色汽车必须是无理的，愚蠢的（我们期望如此罕见）在地球上找到0辆蓝色汽车）。

那么，如果我们改变人们对汽车颜色的描述的准确性，该怎么办？当然，我们可以将其推到极致，并说他们只有50％的时间正确，这并不比掷硬币好。在这种情况下，汽车发蓝的后验概率等于先验概率，因为人们的回答没有告诉我们。但是可以肯定的是，人们至少比这要好一点，即使我们说人们只有51％的时间是准确的，但似然比仍然有效，因此汽车发蓝的可能性大约是倍。 $10^{13}$

这都是您在示例中选择的数量较大的结果。如果有9/10人说这辆车是蓝色的，那将是一个截然不同的故事，即使一个营地与另一个营地中有相同比例的人。因为统计证据并不取决于该比率，而是取决于相对派系之间的数字差异。实际上，在似然比（量化证据）中，说汽车不是蓝色的100个人正好抵消了说蓝色的900个人中的100个人，所以就好像您有800个人都同意它是蓝色的。这显然是非常明确的证据。

（编辑：正如Silverfish指出的那样，我在这里所做的假设实际上暗示着，每当一个人错误地描述一辆非蓝色的汽车时，他们都会默认说它是蓝色。这当然是不现实的，因为他们可以说出任何颜色，并且只会在某些时候说蓝色。但是，这与结论没有什么区别，因为人们将非蓝色汽车误认为蓝色汽车的可能性越小，则当他们说蓝色汽车的证据就越强因此，如果有的话，以上给出的数字实际上只是亲蓝证据的下限。）

— 鲁宾·范·贝根（Ruben van Bergen）
source

11

+1。实际上，根据OP的数据，MLE估计人们准确率的频率为900/1000 = 90％。

— 变形虫

5

在50％的时间内获得正确的汽车颜色与掷硬币不同。毕竟，不仅有两种可用的颜色可供选择。另外，也许有人说“海军”或“天蓝色”而不是“蓝色”？实际上，当正确的答案是“一些看起来像蓝色的奇特而时尚的专利颜色时”，也许人们会错误地说“蓝色”

— Hagen von Eitzen

10

— 银鱼

2

@PatMolloy：不一定。这取决于概率是否对称：是否有人将蓝色误认为是非蓝色汽车，就像有人将蓝色不是误认为是蓝色汽车一样？如果是这样，则500/500的判决给出的信息与抛硬币一样多。但是，如果人们不太可能说非蓝色汽车是蓝色的，而不是说蓝色汽车不是蓝色的，那么在这种情况下，500个说蓝色的人比500个说蓝色的人更难解释。不是蓝色的假设。因此，在那种情况下，证据的平衡会倾向于蓝色。

— 鲁宾·范·伯根

3

颜色感知是一件棘手的事情..如果十分之九的人说一件衣服是白色和金色，那么它是蓝色和黑色的可能性是多少？

— Glen_b

73

正确答案取决于问题中未指定的信息，您将必须做出更多假设才能得出单个确定的答案：

汽车是蓝色的先验概率，即您尚未询问任何人，您就认为汽车是蓝色。
某人告诉您这辆车实际上是蓝色时是蓝色的概率，以及他们告诉您这辆车实际上不是蓝色时是蓝色的概率。
当有人说汽车是蓝色时，汽车实际上是蓝色的概率；当有人说汽车是蓝色时，汽车不是蓝色的概率。

$1000$

\begin{aligned} P_{p o s t} (car is blue) & = P (car is blue ∣ say is blue) P (say is blue) \\ + P (car is blue ∣ say is not blue) P (say is not blue) \end{aligned}

$\begin{align*} P_{post} (\text{car is blue}) &= P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue}) \\ & \ \ \ \ + P(\text{car is blue} \mid \text{say is not blue}) P(\text{say is not blue}) \end{align*}$

$P(\text{say is blue})$

\begin{aligned} P (say is blue) = & P (say is blue ∣ car is blue) P_{p r i o r} (car is blue) \\ + P (say is blue ∣ car is not blue) P_{p r i o r} (car is not blue) \end{aligned}

$\begin{align*} P(\text{say is blue}) = \ &P(\text{say is blue} \mid \text{car is blue}) P_{prior}(\text{car is blue}) \\ &+ P(\text{say is blue} \mid \text{car is not blue}) P_{prior}(\text{car is not blue}) \end{align*}$

因此，贝叶斯法则的两个应用程序将您带到了那里。您将需要根据有关特定情况的信息或进行一些合理的假设来确定未指定的参数。

您可以根据以下假设进行其他组合：

P (say is blue ∣ car is blue) P (car is blue) = P (car is blue ∣ say is blue) P (say is blue)

$P(\text{say is blue} \mid \text{car is blue}) P(\text{car is blue}) = P(\text{car is blue} \mid \text{say is blue}) P(\text{say is blue})$

首先，您不了解这些事情。因此，您必须对其中的三个做出合理的假设，然后从那里确定第四个。

— 马修·德鲁里
source

5

通常就是这种情况。然后，您有两个选择，假设蓝色和非蓝色的可能性相同，则表示您完全缺乏知识。对这个领域进行快速调查，这样可能会有所帮助：en.wikipedia.org/wiki/Car_colour_popularity

— Matthew Drury

18

@Matthew“蓝色和非蓝色同样可能”的问题是不一致。如果我们对每种可能的汽车颜色应用相同的推理，我们最终会声称，它们同时具有50％的几率（根据概率法则不可能有两种以上的颜色）和少于50％的几率（当您选择在“非白色”和“非红色”中查看蓝色，这也会导致矛盾，因为任何颜色的概率不能取多个值）

— Glen_b

2

除此之外，还有更多未指定的信息，因为人们的答案不必独立（实际上，我们希望他们的答案与客观颜色密切相关，因此远非独立的）。如果答案“过于”依赖怎么办？假设我们只问了十个随机行人，但每个人都回答了100次吗？

— 哈根·冯·埃岑

2

P (Joe and Mary say blue | car is blue) = P (Joe says blue | car is blue) \cdot P (Mary says blue | car is blue)

$P(\text {Joe and Mary say blue} | \text {car is blue}) = P(\text {Joe says blue} | \text {car is blue}) \cdot P(\text {Mary says blue} | \text {car is blue})$

15

@Glen_b：世界上只有两种颜色，蓝色和非蓝色。不可否认，两者都有多种色调，尤其是非蓝色。

— psmears '17

13

有一个重要的假设，即您的1000条意见不会有系统的偏见。这是一个合理的假设，但在其他情况下可能很重要。

例如：

它们都有相似的色盲现象（例如群体遗传学），
他们晚上都在橙色钠路灯下看到汽车，
它们都具有一种共同的文化，在这种文化中，蓝色是禁忌或不可思议的关联（这偏颇了他们是否将任何物体描述为蓝色或使用文化委婉语或其他方式），
他们都被告知（或有一个共同的信念），如果他们不回答某些特定问题，他们就会发生好/坏的事情.....

在这种情况下不太可能，但是在其他情况下是一个重要的隐含假设。也不必那么极端-将您的问题转移到其他领域，这将是一个真正的因素。

答案可能受到共同偏见影响的每个例子：

询问高高的薄玻璃杯是否比实际使用的短脂肪玻璃杯更多，但您的1000位受访者是很小的孩子（共同的误解）。
向1000人询问在梯子下行走是否有危险（普遍的文化信仰）
在他们认为自己的伴侣会知道答案的情况下，向1000名已婚人士询问是否爱自己的伴侣/有外遇。上下文可以是电视节目，也可以是在被问到时有伴侣在场等（对后果的普遍看法）

不难想像一些结构上相同的问题，其中900：100的回答是对信念和诚实的衡量，或其他，并且没有指出正确的答案。在这种情况下不太可能，但在其他情况下-是的。

— 斯泰利兹
source

11

您从不同的人那里得到不同答案的原因之一是，可以用不同的方式来解释问题，并且不清楚此处的“概率”是什么意思。理解问题的一种方法是使用马修答案中的贝叶斯规则分配先验和推理。

在询问概率之前，您必须确定将什么建模为随机模型，将哪些模型为非随机模型。未知但固定数量的物体应优先分配，这并不是普遍接受的。这是一个与您类似的实验，着重说明了问题所在：

$X_i$ $i = 1, \dots, 1000$ $p = 0.5$ $X_i$ $\sum_{i = 1}^{1000}X_i = 900$

$p$ $p$

— 埃克瓦尔
source

1

因此，如果您删除汽车是蓝色的假设，而其余部分相同，则900个人说蓝色，而100个人说不是，那么这种可能性是0.9？

— 用户

不，它更接近1。这是非常非常不可能的，每1000人中有900人会弄错颜色。

— gnasher729

1

the probability is either one or zero, depending on whether the car is actually blue or not.据我所知，这与对“概率”的理解不符。听起来有点像“ X可能发生或不可能发生，因此概率必须为50％”。您能否更清楚地说明该句子的意思？

— AnoE

2

@AnoE的区别类似于参数和随机变量之间的区别。在问题的背景下给出的结论是，汽车实际上是蓝色的，它的颜色不是随机实验的结果。从本质上讲，这是一个常客诉贝叶斯主义的解释。如果将硬币翻转1000次并观察900个头，那么该硬币公平的概率是多少？如果您是常客（或无聊的人），则为1或0；否则为0。我们不给参数分配概率。

— ekvall '17

@用户否，我已经更新了答案以使观点更清楚。

— ekvall '17

7

简单实用的答案：

根据您的假设，概率很容易在0％到100％之间变化

尽管我真的很喜欢现有的答案，但实际上，基本上可以归结为以下两种简单情况：

方案1：假定人们在识别蓝色时非常擅长识别蓝色... 0％

在这种情况下，有很多人说这辆车不是蓝色的，所以这辆车实际上不是蓝色的可能性很小。因此，概率接近0％。

方案2：假定人们在非蓝色时会非常擅长识别非蓝色... 100％

在这种情况下，有很多人说这辆车是蓝色的，很可能确实是蓝色的。因此，概率接近100％。

当然，从数学的角度出发，您会从类似“让我们假设相关概率为...”之类的通用词开始，这是毫无意义的，因为此类情况通常在任何随机情况下都不为人所知。因此，我主张着眼于极端，以把握这样的思想：两个百分比都可以通过简单而现实的假设轻松地证明其合理性，因此，没有一个有意义的答案。

— 丹尼斯·贾赫鲁丁（Dennis Jaheruddin）
source

2

如果“假定人们非常擅长识别蓝色”，那么为什么在方案1中不是蓝色的情况下，为什么他们会估计它为蓝色？您可能想用假阳性和假阴性来表达您的方案。

— 海德

@hyde重新修改了场景以消除歧义

— Dennis Jaheruddin

假阳性悖论

— Barmar

5

您需要开发一些估计框架。您可能会问的一些问题是

有多少种颜色？我们在说两种颜色吗？还是彩虹的所有颜色？
颜色有多鲜明？我们在说蓝色和橙色吗？还是蓝色，青色和绿松石色？
变蓝意味着什么？是青色和/或绿松石蓝色吗？还是蓝色本身？
这些人在估计颜色方面有多好？他们都是平面设计师吗？还是他们色盲？

从纯粹的统计角度来看，我们可以对最后一个做出一些猜测。首先，我们知道至少有10％的人选择了错误的答案。如果只有两种颜色（来自第一个问题），那么我们可以说存在

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

快速检查一下，如果将它们加在一起，我们将得到100％。您可以在@MatthewDrury答案中看到更多的数学符号。

我们如何获得第三者的90％？有多少人说蓝色，但不是。因为只有两种颜色，所以它们是对称的。如果存在两种以上的颜色，那么当他们说别的东西的时候，错误选择的机会就是蓝色。

无论如何，这种估算方法使我们得到了90％的蓝色。其中包括81％的人说蓝色的机会和9％的人说不是蓝色的机会。这可能是我们最能回答原始问题的方法，它要求我们依靠数据来估计两个不同的事物。并假设选择蓝色的几率与选择蓝色的几率相同。

如果有两种以上的颜色，那么逻辑将有所改变。前两行保持不变，但在后两行中我们失去了对称性。在这种情况下，我们需要更多的投入。可以想象，我们可能会再次估计正确地将蓝色表示为81％的机会，但是我们不知道当有人说不是时，蓝色的可能性是多少。

我们甚至还可以改进两种颜色的估计。给定统计上每种颜色的汽车的数量，我们可以统计出大量的人对它们进行查看和分类。然后，我们可以计算出人们在做出每种颜色选择时正确的频率以及对每种颜色选择正确的频率。然后，根据人们的实际选择，我们可以更准确地估算。

您可能会问90％可能是错的。考虑一下如果有三种颜色会发生什么：天蓝色，蓝色和蓝宝石。有人可能会合理地认为所有这三个都是蓝色的。但是我们想要更多。我们想要确切的阴影。但是谁记得其他阴影的名称呢？许多人可能会猜到蓝色，因为它是他们知道的唯一匹配的阴影。而且当它变成天蓝色时仍然是错误的。

— 布赖森
source

正如前面的评论中提到的那样，肯定只有两种相关的颜色是“蓝色”和“不是蓝色”，因此不需要关于多种颜色的部分。

— 丹尼斯·贾赫鲁丁

4

一个精确的，数学的，真/假的概率不能计算与你提供的信息。

但是，在现实生活中，此类信息永远无法确定。因此，按照我们的直觉（如果我们下注，我所有的钱都将流到哪里），那辆车肯定是蓝色的。（有些人认为这不再是统计数据了，但是，科学的黑白观点不是很有用）

推理很简单。假设汽车不是蓝色的。然后90％的人（！）错了。它们可能仅是错误的，原因是存在以下一系列问题：

色盲
病理性说谎
受酒精，LCD等物质的影响
不明白这个问题
其他形式的精神障碍
结合以上

由于上述情况显然不会影响90％的平均随机人口（例如色盲影响大约8％的男性和0.6％的女性，即1000人中有43人），因此汽车一定是蓝色。（那是我所有的钱都会去的）。

— Luchonacho
source

从直觉上看，这对我来说很正确。我认为对原始问题的批评是，它没有提供足够的信息，必须做出某些假设..好吧，现实世界中的情况并非总是如此吗？？？

— Pat Molloy

@PatMolloy它没有提供足够的信息来提供正确的/错误的复杂数学答案（当然，这是许多从该网站上寻求解决的问题）。但是，鉴于您提供的信息减少了，因此在投注时，这是人们会选择的答案（100％）。

— luchonacho

1

我认为您没有涵盖一些最合理的选择-这些选择应该导致您修改结论。其中包括：（a）人们无法识别蓝色；（b）质询者和答卷者之间对“蓝色”没有共识；（c）“蓝色”的“科学”含义不同于人们通常理解的“蓝色”。重要的是，由于您无法量化这些备选方案中的任何一个，也无法量化列出的大多数备选方案，因此，如何证明量化答案的可能性是合理的？那不是统计数据！

— ub

“由于以上情况显然不会影响平均随机人口的90％”，请对此不太确定。请记住，在讨论人类时，我们通常以平均数来谈论。可以肯定的是，只有少数百分率有色盲（与平均水平相比），但是可能有少数具有更好视力的色盲，例如四色盲。

— NPSF3000 '17

2

我一直受LCD的影响

— Alex

2

我不会因为数十亿只蝇没错的事实而吃掉粪便。可能还有许多其他原因导致千分之千的人被骗认为汽车是蓝色的。毕竟，这是魔术的基础，可以吸引人们思考那些脱离现实的事物。如果每千人中有900人看到魔术师在刺杀他/她的助手，他们会立即回答助手被刺了，因为在舞台上发生的凶杀案是多么不可能。反光汽车漆上的蓝灯，有人吗？

— 174
source

2

被调查者对于为准确回答问题而进行的民意调查知之甚少。就他而言，民意调查可能会遇到几个问题：

参加民意测验的人可能会有偏见：

由于视线错觉，汽车显得蓝色。
由于某种原因，汽车的颜色难以观察，在此之前，人们出于某种原因向人们展示了很多蓝色的汽车，因此大多数人都认为这辆汽车也可能是蓝色的。
您付钱给他们是说汽车是蓝色的。
您有人催眠了所有人，使他们相信这辆车是蓝色的。
他们订立了一项谎言来破坏民意测验。

参加投票的人之间可能存在相关性，这是由于他们的选择方式或彼此之间的影响：

您不小心在群众大会上对具有相同色盲的人进行了调查。
您在幼儿园进行了调查；女孩们对这辆车不感兴趣，大多数男孩子都把蓝色当做自己喜欢的颜色，使他们想象这辆车是蓝色的。
看到汽车的第一个人醉了，以为它看上去是蓝色的，大喊“ IT IS BLUE”，影响其他所有人以为汽车是蓝色的。

因此，尽管如果完全正确地进行了民意调查，则汽车发蓝的可能性非常高（如鲁宾·范·伯根的回答中所述），但民意调查的可靠性可能已经受到损害，这使得汽车发蓝的可能性不大。微不足道。被调查者估计这次机会最终有多大，取决于他对情况在民意测验中被搞砸的可能性以及您进行民意测验的能力（以及他认为自己的调皮程度）的估计。

— 你好再见
source

2

“ blue”的解释是什么？

不同的文化和语言具有不同的蓝色概念。IIRC，一些文化在蓝色的概念中包括绿色！

像任何自然语言单词一样，您只能假定在何时（和何时不）将事物称为“蓝色”有一定的文化习惯。

总体而言，语言中的颜色令人惊讶地主观（来自以下评论的链接，感谢@Count Ibilis）

— Anony-Mousse
source

7

在问题的上下文中，我认为这个特定方面是不相关的-我认为OP选择了“蓝色”一词作为非常通用的术语，而不是人们可能不确定的诸如“天青”，“龟甲”之类的东西。同样，汽车通常倾向于使用非常有限的可能/常用颜色的调色板。最后，问题不是“为什么100个人说非蓝色”，而是“汽车实际上是蓝色的概率”。

— AnoE

2

vimeo.com/120808489

— 伯爵

精确的定义是“在当前环境条件下辐射的波长主要为475nm加上负10-20nm的光”。通常被认为是蓝色。

— rackandboneman

是的，但是有多少人随身携带用于测量主要波长的工具？您还忘记了排除不可见的波长。

— Anony-Mousse

1

问题似乎是关于统计地使用一群未知校准的人作为波长计:)

— rackandboneman

1

根据更精确的前提条件，可能性可能是几个不同的值，但是99.995％对我来说最有意义。

根据定义，我们知道这辆车是蓝色的（100％），但是并没有明确说明这实际上意味着什么（这在某种程度上是哲学上的）。我会假设某种东西是蓝色的，实际上可以看作是蓝色。

我们也知道90％的测试对象将其报告为蓝色。

我们不知道被问了什么或如何进行评估，以及汽车在什么照明条件下。被要求命名颜色时，一些受试者可能由于照明条件而说“绿蓝色”，而评估者可能还不算是“蓝色”。如果问题是“这是蓝色吗？”，同一个人可能会回答“是”。我将假设您不打算恶意欺骗您的测试对象。

我们知道，tritanopy的发生率约为0,005％，这意味着如果汽车实际上可以看成蓝色，那么99.995％的测试对象确实看到了蓝色。但是，这意味着9.995％的测试对象在清楚地看到蓝色时没有报告蓝色。他们在撒谎。这也与您的生活经历告诉您的非常接近：人们并不总是诚实的（但是，除非有动机，他们通常都是诚实的）。

因此，非观察者可以以绝对的信心认为汽车是蓝色的。那将是100％

除了……除非非观察者本人患有三角虫病，否则即使其他所有人（或更确切地说，其中90％的人）都这样说，她也不会将汽车视为蓝色。在这里，它又重新成为一种哲学：如果其他人都听到一棵树倒下了，但我没有，那棵树倒下了吗？

我敢说最合理，最实用的答案是：如果非观察者恰巧是三足动物（0.005％的机会），那么验证预测的颜色和所见的真实颜色是否相同将产生错误。因此，可能性为99.995％，而不是100％。

此外，作为奖励，因为我们发现9.995％的测试对象是骗子，而且众所周知所有克里特岛人都是骗子，所以可以得出结论，我们不在克里特岛！

— 达蒙
source

1

您有一辆蓝色的汽车（通过客观的科学测量-它是蓝色的）。

...

“汽车发蓝的概率是多少？”

它是100％蓝色的。

他们只知道900个人说它是蓝色，而100个人则不是。您对这些人（千人）一无所知。

使用这些数字（没有任何上下文）完全是胡说八道。一切都归结为对问题的个人解释。我们不应该走这条路，而要使用维特根斯坦的著作：“沃夫人尼克·斯普雷琴·坎恩，达鲁伯·穆斯·施威根。”

想象以下问题进行比较：

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

这基本上是相同的（信息较少）问题，但是更清楚的是，我们对汽车颜色的看法主要是（如果不是完全的话）情况。

从长远来看，当我们获得多个相关问题时，便能够开始猜测这些不完整问题的答案。这适用于针锋相对的算法，在单个情况下不起作用，但从长远来看确实有效。同样，维特根斯坦（Wittgenstein）从他的早期调查工作和《首席调查官》中回来了。我们能够回答这些问题，但是我们需要更多信息/试验/问题。这是一个过程。

— 马丁·韦特林斯
source

0

如果我们假设汽车是蓝色的，那么千分之100的人说它不是蓝色就意味着某种极端的样本偏差。也许您只在色盲人群中采样。如果我们假设汽车不是蓝色的，那么样本偏差会更糟。因此，我们可以从给定的数据得出的结论是，样本非常有偏差，并且由于我们不知道其偏差程度，因此无法得出有关汽车颜色的任何结论。

— 迈克·斯科特
source

嗯，肯定有900个人说它是蓝色的事实对某件事有好处吗？我们不能得出结论，蓝色更有可能是蓝色吗？记住，受访者只知道数字900和100。那么他们真的能说出偏见吗？

— Pat Molloy

0

有一些答案。我绝对不是数学大师，但是，这是我的。

只能有4种可能性：

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

从问题中可以看出，案例1和案例4的总和为900人（90％），案例2和案例3的总和为100人（10％）。但是这里有个问题：您不知道这两个案例对中的分布。可能情况1和情况4的总和完全由情况1（这意味着汽车是蓝色）组成，或者可能全部由情况4（这意味着汽车不是蓝色）组成。情况2 + 3的总和也是如此。所以...您需要提供某种方法来预测案件总数内的分布。问题中没有其他指示（没有地方说人们80％知道他们的颜色或类似的东西），您不可能拿出一个确定的答案。

话虽如此...我确实怀疑预期的答案可能与以下内容类似：

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

如果仅剩下未知的50％，则将其称为误差容限。

— TuncayGöncüoğlu
source

0

$X,Y_1,Y_2,\ldots,Y_{1000} \in \{0,1\}$ $1$ $p(x)$ $p_x$ $Y_i|X=1$ $p_1$ $Y_i|X=0$ $p_0$ $\theta = (p_x,p_0,p_1)$

$p(\theta,x|y_{1:1000}) \propto p(\theta)p(x|\theta)\prod_{i=1}^{1000}p(y_i|x)$

$\{x_i\}$ $\{y_i|x\}$

— 泰勒
source

-3

看不见汽车的人不知道它已被科学证明是蓝色的。对他/她来说，汽车是蓝色的概率是50/50（它是蓝色，或者不是）。轮询其他人可能会影响此人的意见，但不会改变看不见的汽车为蓝色或蓝色的可能性。

以上所有数学方法都确定了样本集可以确定其是否为蓝色的概率。

— 玉米面包
source

我不确定它是蓝色的概率是50/50是真的。实际上，它远小于50，因为它可能是红色，白色，黄色等。随机选择的汽车是蓝色的可能性远小于50％。

— 用户

如果每千人中有900人说汽车是蓝色的，那么它是蓝色的概率是多少？

简单实用的答案：

方案1：假定人们在识别蓝色时非常擅长识别蓝色... 0％

方案2：假定人们在非蓝色时会非常擅长识别非蓝色... 100％

“ blue”的解释是什么？