对于条件概率公式的基本直觉,我总是喜欢使用双向表。假设一年中有150名学生,其中80名女性和70名男性,每个人都必须学习一门语言课程。参加不同课程的学生的双向表是:
| French German Italian | Total
-------- --------------------------- -------
Male | 30 20 20 | 70
Female | 25 15 40 | 80
-------- --------------------------- -------
Total | 55 35 60 | 150
假设有一个学生学习意大利语课程,那么他们成为女性的几率是多少?那么意大利语课程有60名学生,其中有40名是学习意大利语的女性,因此概率必须是:
P(F|Italian)=n(F∩Italian)n(Italian)=4060=23
其中是集合A的基数,即它包含的项数。请注意,我们需要使用ñ (˚F ∩ 意大利)在分子和不只是ñ (˚F ),因为后者会包括所有的80位女性,包括其他40谁不学习意大利语。n(A)An(F∩Italian)n(F)
但是,如果问题被抛弃,那么假设他们是女性,那么学生修读意大利语课程的概率是多少?然后,在80名女学生中,有40名参加了意大利语课程,因此我们有:
P(Italian|F)=n(Italian∩F)n(F)=4080=12
我希望这为为什么提供了直觉
P(A|B)=n(A∩B)n(B)
理解为什么可以用概率而不是基数来写分数是等效分数的问题。例如,让我们回到假设学生正在学习意大利语的情况下,该学生是女性的可能性。总共有150名学生,因此,一个学生是女性并且学习意大利语的概率是40/150(这是“联合”概率),而一个学生学习意大利语的概率是60/150(这是“边际”概率) )。请注意,联合概率除以边际概率得出:
P(F∩Italian)P(Italian)=40/15060/150=4060=n(F∩Italian)n(Italian)=P(F|Italian)
(要看到分数是等价的,将分子和分母乘以150会除去每个中的“ / 150”。)
更一般而言,如果您的采样空间具有基数n (Ω )(在此示例中,基数为150),我们发现Ωn(Ω)
P(A|B)=n(A∩B)n(B)=n(A∩B)/n(Ω)n(B)/n(Ω)=P(A∩B)P(B)