如果“ B更有可能给定A”,那么“ A更有可能给定B”


9

我试图获得更清晰的直觉:“如果使更有可能,那么使更有可能”ABBA

令表示和所在的空间的大小,然后n(S)AB

要求:使得P(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)

所以n(AB)/n(B)>n(A)/n(S)

这是P(A|B)>P(A)

我理解数学,但是为什么这很直观?


1
我编辑了问题,删除了“ make”一词。这个问题听起来有点像Facebook上那些模棱两可的问题,在那儿您必须用图片解决一些代数和,并且由于对问题的不同解释,人们得到的答案也大不相同。那不是我们想要的。(另一种方法是关闭不清楚的问题,并让OP对其进行更改)。
Sextus Empiricus

Answers:


10

凭直觉,像彼得·弗洛姆(Peter Flom)这样的现实世界例子对某些人最有帮助。通常可以帮助人们的另一件事是图片。因此,为了涵盖大多数基础,让我们来看看一些图片。

显示独立性的条件概率图 显示依赖关系的条件概率图

我们在这里有两个非常基本的图,它们显示了概率。第一个显示两个独立谓词,我将其称为Red和Plain。显然,它们是独立的,因为线对齐。红色的平原区域所占比例与红色的条纹区域所占比例相同,并且与红色的总面积所占比例相同。

在第二张图中,我们有非独立分布。具体来说,我们将一些普通的红色区域扩展到了条纹区域,而没有改变它是红色的事实。显然,变红色使变白的可能性更大。

同时,看看该图像的普通面。显然,红色的普通区域所占的比例大于红色的整个图像所占的比例。那是因为平原地区被赋予了更多的区域,并且所有区域都是红色的。

因此,红色使平原更可能出现,而平原使红色更有可能出现。

这里到底发生了什么?当包含A和B的区域都大于独立区域时的预测面积时,A是B的证据(也就是说,A使B更有可能)。因为A和B之间的交集与B和A之间的交集相同,所以这也意味着B是A的证据。

需要注意的一点是:尽管上面的论点看起来很对称,但是在两个方向上证据的强度可能并不相等。例如,考虑此第三张图像。 这里发生了同样的事情:纯红色吞噬了以前属于条纹红色的区域。实际上,它已经完全完成了工作!显示极端依赖的条件概率图

请注意,由于没有红色的条纹区域,所以完全红色的点可以保证清晰。但是,保持纯色的点并不能保证发红,因为还剩下绿色区域。但是,方框中的一个点为纯色会增加它变成红色的机会,而红色的点会为它增添一个平原的机会。两个方向暗示的可能性更大,只是数量不同。


我喜欢这些图像:)但是,看起来好像是图像或说明被翻转了:In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. -您的第二个图像比第一个图像获得了平坦区域,因此从图像1到2,我们将平原区域移到了条纹区域。
波德

因此,如果我的维恩图具有一些常见的A,B相交区域,而我要做的就是增加该相交区域,那么我会自动为整个空间添加更多的A,B(而不会使空间变大)并更改/增加n(A )/ n(S)和n(B)/ n(S)作为结果。对?还有更多评论吗?
拉胡尔·迪奥拉

4
对于色盲人来说,红色与绿色是一个有问题的组合。
理查德·哈迪

@Pod我认为这是您所描述的自然语言歧义。阅读“我们已经搬进了一些条纹的红色区域的进入平原区”为“我们已将一些地区的前身是红色条纹 ,改变它进入平原区”。我认为您误读为“我们一些有条纹的红色区域扩展到了以前称为平原的区域
彼得-恢复莫妮卡

20

我认为另一种数学表达方式可能会有所帮助。在贝叶斯规则的范围内考虑索赔:

要求:如果则P(B|A)>P(B)P(A|B)>P(A)

贝叶斯规则:

P(AB)=P(BA)P(A)P(B)

假设非零。从而P(B)

P(A|B)P(A)=P(B|A)P(B)

如果 ,则。P(B|A)>P(B)P(B|A)P(B)>1

然后,所以。P(A|B)P(A)>1P(A|B)>P(A)

这证明了这一主张和更强有力的结论-可能性的各个比例必须相等。


我喜欢这一点,因为它显示出更强的链接“如果A使B的可能性更高,那么B使A的
可能性

@probabilityislogic用这种方式表达会引起歧义。如果先验概率为10%,后验概率为15%,则概率增加了5%(15%减去10%)还是50%(15%除以10%)?
累积

一个更简单的证明:如果,则使用该规则和贝叶斯规则,我们得到P A | B = P B | A P A / P B > P B P A / P B = P A P(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)

12

好吧,我不喜欢这个问题中的“ makes”一词。这意味着某种因果关系和因果关系通常不会逆转。

但是你要求直觉。因此,我考虑一些示例,因为这似乎激发了直觉。选择一个您喜欢的:

如果一个人是女性,则该人更有可能投票给民主党人。
如果某人投票支持民主党,则该人更有可能是女性。

如果一个人是职业篮球中心,那么他的身高可能超过2米。
如果一个人的身高超过2米,那么他很有可能是篮球中心。

如果温度超过40摄氏度,则更可能发生停电。
如果发生停电,则很有可能超过40度。

等等。


4
这与概率无关。大约是一对一的关系。
彼得·弗洛姆

6
@jww想象一下这样的语句:“如果正在下雨,那条街是湿的”(并假设这是当前的有效含义,而相反则不是)。现在,在不同的时间和地点获取大量的“样本”,您可以在其中记录是否下雨以及街道是否潮湿。在下雨的样本中,与没有雨的样本相比,这条街会更湿。但,将在更多所在街道比所在街道为干样品湿样品下雨。那是概率。
hobbs

3
两种现象都是由相同的含义引起的。暗示仅以一种方式起作用,但是观察结果可能会使您更有可能看到先例为真的样本。
hobbs

7
@Barmar对不起,但这部分证明了我的逻辑的正确性。因为说36 / 25,000比1 / 150,000,000高很多。
Peter Flom

7
比身高不到2米的人更有可能。
彼得·弗洛姆

9

要补充@Dasherman的回答:说两个事件是相关的,或者可能是关联的还是相关的,这意味着什么?也许我们可以定义一个比较联合概率(假设): 因此,如果大于1,则和在一起出现的频率要高于独立时。那么我们可以说和正相关。P(A)>0,P(B)>0

η(A,B)=P(AB)P(A)P(B)
ηABAB

但是现在,使用条件概率的定义,是的简单结果。但是在完全对称和(互换符号的所有匹配与反之亦然)离开相同的公式,因此也等同于。这给出了结果。因此,您要求直觉是在和是对称的。P(AB)P(A)P(B)>1P(BA)>P(B)P(AB)P(A)P(B)ABABP(AB)>P(A)η(A,B)AB

@gunes的答案给出了一个实际的例子,并且很容易以相同的方式来使其他人。


2

如果A使B更可能发生,则意味着事件以某种方式相关。这种关系是双向的。

如果A使B更有可能,这意味着A和B倾向于同时发生。这意味着B也使A更有可能。


1
这也许可以使用一些扩展?没有相关的定义,它有点空。
mdewey

2
由于OP要求提供直观的解释,因此我一直在努力避免任何严格的操作。没错,它现在已经很空了,但是我不确定如何以直观的方式扩展它。我增加了尝试。
Dasherman

2

如果A使B更有可能,则A具有B可以推断出的重要信息。尽管事实上它可能不会贡献相同的数量,但信息不会以其他方式丢失。最终,我们有两个事件相互支持。我似乎无法想象这样一种情况:A的出现会增加B的可能性,而B的出现会降低A的可能性。例如,如果下雨,则地板很可能变湿,而如果地板下雨,湿,这并不意味着下雨,但不会减少机会。


2

您可以通过想象一个列联表来使数学更直观。

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • 当和独立时,联合概率就是边际概率的乘积在这种情况下,您将具有相似的边际和条件概率,例如和。AB

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    P(A)=P(A|B)P(B)=P(B|A)

  • 当没有独立性时,您可能会看到这使参数保持不变(与边距的乘积相同),但仅需通过a,b,c,d±z

    A¬A1x1xBya+zbz¬B1yczd+z

    您可能会看到此破坏了边际概率和条件概率的相等性,或者破坏了作为边际概率乘积的联合概率的关系。z

    现在,从这种观点(打破这些平等)出发,您可以看到这种破裂以两种方式发生:和。和不等式将是这两种情况下当为正且当为负。P(A|B)P(A)P(B|A)P(B)>z<z

因此,通过联合概率可以看到连接然后。P(A|B)>P(A)P(B|A)>P(B)P(B,A)>P(A)P(B)

如果A和B经常一起发生(联合概率更高,则为边际概率的乘积),那么观察一个将使另一个的(有条件的)概率更高。


2

假设将事件的后验概率比表示为:

Δ(A|B)P(A|B)P(A)

然后,贝叶斯定理的另一种表达形式(请参阅相关文章)是:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

后验概率比告诉我们是否通过条件事件的发生使争论事件或多或少地发生(以及或多或少地发生)。上面的贝叶斯定理形式表明使用后验概率比在变量中是对称的。 例如,如果观察使可能性比其先验的可能性大,则观察使可能性比其先验的可能性大。BAAB


请注意,这是一个概率规则,因此不应有因果关系。对于被动观察,这种对称性在概率意义上是正确的-但是,如果您干预系统以更改或,则不是正确的。在后一种情况下,您将需要使用因果运算(例如运算符)来查找条件变量更改的影响。ABdo


1

有人告诉您,山姆(Sam)是女人,金(Kim)是男人,两个人中的一个化妆,另一个不化妆。您猜他们中谁会化妆?

有人告诉您Sam化妆,而Kim不化妆,两个人之一是男人,一个是女人。你会猜谁是那个女人?


将此与原始问题联系起来并不是那么简单。事件A到底是什么,事件B是什么?这里似乎更像是几率的比较。事件A是“ x是一个女人”(不是事件A是“ x是一个男人”)。事件B是“ x穿妆”。但是现在我们突然有了一个山姆和一个金,这是从哪里来的,我们应该使用任何有关其名字的主观男性气质或女性气质的信息吗?
Sextus Empiricus

1

因果关系和关联之间似乎有些混淆。的确,由于原因,问题陈述是错误的,例如以下示例所示:

  • 如果狗戴着围巾,那么它就是被驯化的动物。

以下是不正确的:

  • 看到被驯养的动物戴着围巾暗示它是狗。
  • 看到家养的狗意味着它戴着围巾。

但是,如果您正在考虑概率(相关性),那么它是对的:

  • 戴围巾的狗比不戴围巾的狗(或一般意义上的动物)更可能是家养动物

以下是正确的:

  • 戴围巾的家养动物比其他动物更可能是狗。
  • 与未驯化的狗相比,驯养的狗更可能戴围巾。

如果这不直观,请考虑一下包括蚂蚁,狗和猫在内的动物。狗和猫都可以被驯养并且可以戴围巾,而蚂蚁则不能。

  1. 如果您增加家中有动物被驯化的可能性,这也意味着您会增加看到动物戴围巾的机会。
  2. 如果增加猫或狗的机率,那么也会增加看到动物戴围巾的机率。

被驯化是动物与戴围巾之间的“秘密”纽带,而这种“秘密”纽带将双向发挥作用。

编辑:在注释中举例说明您的问题:

想象一个动物是猫还是狗的世界。它们可以被驯化或不被驯化。他们可以不戴围巾。想象一下,总共有100只动物,50只狗和50只猫。

现在将陈述A视为:“ 戴围巾的狗比不戴围巾的狗更可能是被驯化的动物的三倍 ”。

如果A不正确,那么您可以想象世界可能由50只狗组成,其中25只被驯养(其中10条戴围巾),其中25只野狗(其中10条戴围巾)。猫的统计数据相同。

然后,如果您看到这个世界上的家养动物,则有50%的机会成为狗(25 / 50,50只家养动物中有25只狗)和40%的时候有围巾(20 / 50,10条狗) 50只家养动物中有10只猫)。

但是,如果A为真,那么您的世界有50只狗,其中25只为家犬(其中15条戴围巾),25条为野狗(其中5条戴围巾)。猫保持旧的状态:50只猫,其中25只已驯化(其中10条戴围巾),25只野生(其中10条戴围巾)。

然后,如果您看到了这个世界上的家养动物,那么它有50%的几率成为狗(25 / 50,50只家养动物中有25只狗),但有50%的几率(25/50,有15只狗, 50只家养动物中有10只猫)。

如您所见,如果您说A是正确的,那么如果您看到家养的动物在世界上戴着围巾,那么与其他任何动物(在这种情况下)相比,狗(60%或15/25)的可能性更大Cat,40%或10/25)。


这是我的问题:“戴围巾的家养动物比其他动物更可能是狗。” 当我们发表最初的声明时,我们没有对其他可能戴围巾的动物提出任何要求。可能有100个。我们只发表了关于狗的声明。
拉胡尔迪奥拉

查看我的修改是否对您的特定问题有所帮助。
H4uZ

0

因果关系和相关性之间存在混淆。因此,我将举一个例子说明发生完全相反的情况。

有些人有钱,有些人很穷。一些穷人得到了福利,这使他们减少了贫困。但是,即使有了福利,获得福利的人仍然更有可能成为穷人。

如果您得到了好处,那么更有可能买得起电影票。(“更有可能”表示因果关系)。但是,如果您负担得起电影票,那么您就不太可能成为穷人而无法获得利益,因此,如果您负担得起电影票,则获得利益的可能性就较小。


5
这不是问题的答案。有趣,但不是答案。实际上,这是在讨论另一种情况。相反,发生这种情况的原因是它使用了两个名称相似的度量标准(贫乏无益与贫富无益),因此情况完全不同。
wizzwizz4

0

如果您看一下更强烈的陈述,直觉就会变得很清楚:

如果A暗示B,则B使A更有可能。

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

显然,如果已知B也为真,则A更有可能为真,因为如果B为假,那么A也将为真。同样的逻辑适用于较弱的语句:

如果A使B更有可能,那么B使A更有可能。

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true

我认为您在第一句话中所说的是在维恩图中,如果A包含在B中,那么如果B为真,则n(A)/ n(B)必须高于n(A)/ n(S)因为B的空间比S小。即使在第二个空间中,您是否也这么说?
拉胡尔迪奥拉

@RahulDeora-是的,就是这样。弱版本不那么明显,但是无论如何您已经进行了数学运算。您要求的是结果背后的直觉,最好在更强的陈述中观察到。
Rainer P.19年

使用此语句获得更多直觉的一个小问题是,这并不完全正确。“暗示B”对于“当B则A更有可能”时不是一个充分的条件。重要的区别在于,使用“ A暗示B”不需要使B更有可能。最重要的例子是B始终为真。
Sextus Empiricus

0

假设爱丽丝的罚球率高于平均水平。然后,假设Alice尝试了一次射击,成功的概率要大于一般的射击成功的概率。我们还可以得出结论,爱丽丝成功投篮的份额要大于她通常的投篮份额:。P(successful|Alice)>P(successful)P(Alice|successful)>P(Alice)

或假设有一所学校的学区中有10%的学生,但有15%的A级学生。那么,该学校中直接A级学生的百分比显然要高于全区范围的百分比。

另一种看待它的方式:给定B,如果,则A更有可能,并且这相对于和是完全对称的。P(A&B)>P(A)P(B)AB

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.