条件概率公式背后的直觉是什么?


30

给定发生的情况下发生条件概率的公式为: P \ left(\ text {A}〜\ middle |〜\ text {B} \ right)= \ frac { P \ left(\ text {A} \ cap \ text {B} \ right)} {P \ left(\ text {B} \ right)}。 AB

P(A | B)=P(AB)P(B).

我的教科书以维恩图的形式解释了其背后的直觉。

在此处输入图片说明

给定B已经发生,\ text {A}发生的唯一方法A是使事件落在A\ text {B}的交集处B

在那种情况下,P(A|B)的概率不等于A交集\ text {B}的概率B,因为那是事件发生的唯一途径吗?我想念什么?


7
如果我们暂时忘记如何计算它,您是否对什么是条件概率有直观的了解?
Juho Kokkala

4
通过限制B(发生的事件),可以将结果空间从(整个平面)限制为B。忘记一切是B.外已经相对于乙待测量事件A的概率,由于概率为0和1之间Ω
Vladislavs Dovgalecs

1
您错过了以下事实:一旦您知道事件B发生,事件A圆圈的白色部分就不再是总体的一部分。
蒙蒂·哈德

4
直觉不是精确的,也不是单数的,那么为什么要问(单数)精确的直觉呢?有用的直觉就足够了,但并非所有建议对所有人都有用。
约翰·科尔曼

Answers:


23

有一个很好的直觉,就是B发生了-有或没有A-A的概率是多少?即,我们现在处于B发生的宇宙中-完整的右圆圈。在该圆中,A的概率为A与B相交的面积除以圆的面积。


5
换句话说-我告诉你发生了,这意味着我们生活在圈子中。在那个世界中,镜头中有百分之几的事件()?BBAB
MichaelChirico

18

我会这样想:我认为您理解直觉直到:

假定发生了B,则A发生的唯一方法是使偶数落在A和B的交点上。

我将评论您发布的第二张图片:

  1. 想象一下,整个白色矩形就是您的样本空间。Ω

    将概率分配给集合意味着从某种意义上来说,您正在对该集合进行度量。这与您测量矩形的面积相同,但是概率是另一种具有特定属性的度量(我对此不再赘述)。

  2. 您知道,其解释如下:P(Ω)=1

    Ω代表所有可能发生的事件和必须发生的事情,因此我们有100%的可能性发生了事情。

  3. 类似地设定具有概率是正比于样本空间的概率。从图形上来说,您看到因此的度量(其概率)必须小于。相同的推理对于集合是有效的。可以测量此集合,其度量为。P Ω Ω P P Ω P AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. 现在,如果你被告知已经发生了,你必须要考虑的,如果是你的“新”。如果是您的“新”那么您可以100%确保发生了所有事情。ΩΩ BBΩBΩB

    那是什么意思呢?这意味着,现在,在“新”竞赛,您必须重新调整所有概率度量,并考虑到必须以“新”样本空间来表示它们。。这是一个简单的比例。BP(BB)=1B

    当您说以下话时,您的直觉几乎是正确的:

P(A | B)的概率将仅等于A交集B的概率

而“几乎”是由于您的样本空间已更改(现在是)而您要相应地重新缩放的事实。P BP(AB)

  1. P P(AB)是新世界中样本空间为。换句话说,您会这样说(并且请尝试通过设置将其形象化):P(AB)B

    在新世界中,度量与度量之间的比率必须与度量与度量之间的比率相同Ω 一个| BABΩAB

  2. 最后,将其翻译成数学语言(简单比例):

P(B):P(AB)=P(Ω):P(AB)

并且由于 因此可以得出:P(Ω)=1

P(AB)=P(AB):P(B)

5

您会发现直觉很容易考虑以下问题。

假设您有10个球:6个黑色和4个红色。黑色球中的3个很棒,红色球中只有1个很棒。黑球还真棒的可能性有多大?

答案很简单:50%,因为在总共6个黑球中,我们有3个超赞黑球。

这是您将概率映射到我们的问题的方式:

  • 黑色和超赞的3个球对应于P(AB)
  • 黑色的6个球对应于P(B)
  • 当我们知道它是黑色时,一个球很棒的概率:P(AB)

1
而不是P B = 6会更有意义吗?n(B)=6P(B)=6
银鱼'18

@Silverfish这会更准确,但是我是在这种情况下感到直觉的
Aksakal

4

对于条件概率公式的基本直觉,我总是喜欢使用双向表。假设一年中有150名学生,其中80名女性和70名男性,每个人都必须学习一门语言课程。参加不同课程的学生的双向表是:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

假设有一个学生学习意大利语课程,那么他们成为女性的几率是多少?那么意大利语课程有60名学生,其中有40名是学习意大利语的女性,因此概率必须是:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

其中是集合A基数,即它包含的项数。请注意,我们需要使用ñ ˚F 意大利在分子和不只是ñ ˚F ,因为后者会包括所有的80位女性,包括其他40谁不学习意大利语。n(A)An(FItalian)n(F)

但是,如果问题被抛弃,那么假设他们是女性,那么学生修读意大利语课程的概率是多少?然后,在80名女学生中,有40名参加了意大利语课程,因此我们有:

P(Italian|F)=n(ItalianF)n(F)=4080=12

我希望这为为什么提供了直觉

P(A|B)=n(AB)n(B)

理解为什么可以用概率而不是基数来写分数是等效分数的问题。例如,让我们回到假设学生正在学习意大利语的情况下,该学生是女性的可能性。总共有150名学生,因此,一个学生是女性并且学习意大利语的概率是40/150(这是“联合”概率),而一个学生学习意大利语的概率是60/150(这是“边际”概率) )。请注意,联合概率除以边际概率得出:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(要看到分数是等价的,将分子和分母乘以150会除去每个中的“ / 150”。)

更一般而言,如果您的采样空间具有基数n Ω (在此示例中,基数为150),我们发现Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

我会颠倒逻辑。B两者均为的概率:AB

  1. 发生的概率,以及给定A发生的概率。BA
  2. B角色相同但角色相反AB

这会给你

p(AB)=p(B)p(AB)

如果您对建议的看法是负面的,那么确实是给定B包含在给定B中的可能性,您掷骰子的空间要小于原始的概率空间-您知道确保您“在” B中,因此您除以新空间的大小。ABB


2

维恩图不代表概率,它代表事件空间子集的度量。概率是两个度量之间的比率;X的概率是“构成X的所有元素”的大小除以“所有正在考虑的事件”的大小。任何时候计算概率时,都需要一个“成功空间”和一个“人口空间”。您不能仅基于成功空间的“大小”来计算概率。例如,掷出两个骰子的7的概率是掷出7的方法的数目除以掷出两个骰子的方法的总数。仅知道滚动七的方法的数量不足以计算概率。P(A | B)是“ A和B都发生”的度量的比率 空间和“ B发生”空间的度量。那就是“ |” 意思是:它的意思是“使人口空间在此之后发生变化”。


2

我认为考虑这一点的最佳方法是画出逐步的路径。

让我们将事件B描述为在合理的骰子上掷出,这很容易证明其概率为14。现在,让我们将事件A描述为从标准52张纸牌中抽出一张A-可以很容易地证明其概率为116113

现在让我们进行一个实验,先掷骰子,然后选一张牌。所以,假设我们已经掷出 4,则 B 就是我们得出A的概率。如果您查看图片,则为 1P(A|B)4路径(向上),然后是116路径(再次向上)。113

直观地,总概率空间就是我们已经给出的:滚动。我们可以忽略1412113最初的下降路线是 13,因为我们给出的结果是4。根据乘法定律,我们的总空间为112134(16×113)+(16×1213)

现在,如果我们掷出,那么我们有多少概率赢得A ?使用路径的答案是14,然后我们需要将其除以总空间。所以我们得到PA(16×113)

P(A|B)=16×113(16×113)+(16×1213).

在此处输入图片说明


2
我想知道下降投票是干什么的,因为概率树可能很有启发性。可能需要担心的是,使用独立事件进行图示会错过条件概率的关键点,即概率分布可能会根据条件事件而改变。使用不太肤浅的插图可能会有所帮助。
ub

1

从数量上考虑一下。边际概率是A发生多少次除以样本大小。A和B的联合概率是A与B一起发生的次数除以样本大小。给定B的条件概率是A与B一起发生的次数除以B发生的次数,即只有A的“在B内”。

您可以在此Blog上找到漂亮的视觉插图,并使用Lego块将其展示出来。


1

在撰写本文时,大约有10个答案似乎都错过了最重要的一点:您本质上是对的。

在那种情况下,P(A | B)的概率不仅仅等于A交集B的概率,因为那是事件发生的唯一途径吗?

P(A|B)P(AB)

我想念什么?

P(BB)=P(B)P(B)AP(A|B)


0

当我们有一个具体的数据来估计概率时,我觉得它更直观。

让我们以mtcars数据为例,数据看起来像这样(我们仅使用气缸数和变速箱类型。)

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

我们可以通过做一个交叉表来计算两个变量的联合分布

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

联合概率意味着我们要同时考虑两个变量。例如,我们将询问4缸和手动变速器有多少辆汽车。

现在,我们来谈谈条件概率。我发现解释条件概率的最直观方法是对数据使用过滤一词

P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

这意味着,我们只在乎汽车有4缸。因此,我们对此进行了过滤。过滤后,我们检查其中有多少是手动传输的。

您可以将条件条件与前面提到的关节进行比较,以体会差异。


0

如果A是发生B的概率的超集,则在A发生的情况下始终为1 B,即P(A|B) = 1。但是,B它本身的概率可能远小于1。

考虑以下示例:

  • 给出的x是1..100中的自然数,
  • A是“ x是偶数”
  • B是' x被10整除'

然后我们有:

  • P(A) 是0.5
  • P(B) 是0.1

如果我们知道该数字x可以被10整除(即xin B),那么我们知道它也是一个偶数(即xin AP(A|B) = 1

根据贝叶斯法则,我们有:

P(A|B)=P(AB)P(B)

P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


对于非简并的示例,请考虑例如A' x是可被7整除并且B' x是可以被3整除”的。那么P(A|B)相当于“假设我们知道x可以被3整除,那么(也)可以被7整除的概率是多少?”。或等效地“数字3、6,...,99的哪一部分可被7整除”?


0

我认为您的最初声明可能是一种误解。

你写了:

一旦B发生,A发生的条件概率的公式为:

从您的措辞看来,好像有2个事件“首先发生B,然后我们要计算A发生的可能性”。

不是这种情况。(无论是否有误会,以下内容均有效)。

我们只有1个事件,由4种可能性之一描述:

  1. AB

  2. AB

  3. BA

  4. AB

P(A)=0.5,P(B)=0.5,andA and B are independent.

P(A and B)=0.25andP(neither A nor B)=0.25.

P(AB)=0.25

BP(AB)P(B)ABP(A|B)0.50.25B


0

条件概率不等于相交概率。这是一个直观的答案:

P(BA)AB

P(AB)AB

A

从第二个概率开始,我们可以推断出第一个概率。

AB

ABA

BAB

事实证明,两种情况都同样可能发生。(我自己无法找出直观原因)。因此,我们必须用加权这两种情况0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

ABA

P(AB)=P(A)P(BA)

Tadaaa ...现在隔离条件的概率!

顺便说一句 我希望有人能解释为什么情形1和2相等。关键在于imo。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.