为什么我们需要西格玛代数来定义概率空间?


122

我们进行了一个随机实验,以不同的结果形成样本空间 Ω,我们感兴趣地观察了某些模式(称为事件 F. 西格玛代数(或西格玛场)由可以分配概率度量P的事件组成。满足某些属性,包括包含空集和整个样本空间,以及描述与维恩图的并集和相交的代数。

概率被定义为之间的函数σ代数和区间[0,1]。总的来说,三元组ΩFP形成了一个概率空间

有人可以用简单的英语解释如果我们没有σ代数的情况,为什么概率大厦会崩溃?它们只是被那个不可能的书法“ F”楔入中间。我相信它们是必要的;我看到一个事件与结果不同,但是如果没有σ代数,会发生什么错误呢?

问题是:在哪种类型的概率问题中,包括σ代数的概率空间的定义成为必要吗?


达特茅斯大学网站上的此在线文档提供了简单易懂的英语说明。这个想法是旋转指针在单位周长的圆周上逆时针旋转:

在此处输入图片说明

我们首先构造一个微调器,它由一个单位圆周的圆和一个指针组成,如图所示。我们在圆上选择一个点并将其标记为0,然后在圆上的每个其他点标记X,从0到该点的距离为逆时针方向。实验包括旋转指针并记录指针尖端处的点的标签。我们让随机变量X表示该结果的值。样品空间显然是间隔[01个。我们想构建一个概率模型,其中每个结果均可能发生。daccess-ods.un.org daccess-ods.un.org如果我们像进行有限数量的可能结果那样进行实验,则必须将概率0分配给每个结果,因为否则,所有可能结果的概率之和将不会等于1。(实际上,对无数个实数求和是一件棘手的事情;特别是,为了使这种和具有任何意义,最多最多可以有许多个求和数可以不同于0)但是,如果所有分配的概率都是0,那么总和应该是 0,而不是1个

因此,如果我们为每个点分配任何概率,并且给定一个(无数个)无穷个点,那么它们的总和将>1个


9
对于不提及测量理论的场寻求答案似乎很不自在!σ
2013年

5
我做到了,但是...我不确定我是否理解您的评论。
Antoni Parellada'3

8
当然,对sigma字段的需求不只是一个见解的问题……我认为这可以在这里作为主题进行讨论(我认为)。
gung

8
如果您对概率论的需求仅限于“头”和“尾”,那么显然不需要场!σ
西安

26
我认为这是一个好问题。因此,您经常在教科书中看到完全多余的概率三元组,然后作者继续完全忽略。(Ω,F,P
dsaxton,

Answers:


124

关于西安的第一点:当您谈论σ代数时,您是在询问可测集,因此不幸的是,任何答案都必须集中在测度理论上。不过,我会尝试逐步解决。

承认不可数集合的所有子集的概率理论将打破数学

考虑这个例子。假设您在有一个单位平方,并且对随机选择一个作为单位平方中特定集合成员的点的可能性感兴趣。在很多情况下,可以根据不同集合的面积比较轻松地回答这一问题。例如,我们可以绘制一些圆,测量其面积,然后将概率作为落入圆中的正方形的分数。很简单。R2

但是,如果兴趣范围不明确怎么办?

如果该区域的定义不明确,那么我们可以得出关于该区域是什么的两个不同但完全有效(在某种意义上)的结论。因此我们一方面可以使,另一方面使P A = 0,这意味着0 = 1。这使所有数学无法修复。现在,您可以证明5 < 0和许多其他荒谬的事物。显然,这不太有用。P(A)=1P(A)=00=15<0

代数是修正数学的补丁σ

确切地说,什么是代数?实际上并不是那么可怕。这只是可以将哪些集合视为事件的定义。不在F中的元素根本没有定义的概率测度。基本上,σ-代数是使我们避免数学的某些病理行为(即不可测量的集合)的“补丁”。σFσ

的三个要求可以看作是我们希望对概率进行的处理的结果:σ场是具有三个属性的集合:σσ

  1. 数不清的工会关闭。
  2. 交叉路口封闭。
  3. 补全封闭。

可数联合和可数相交分量是不可测集合问题的直接结果。下补闭合是柯氏公理的结果:如果P Ç应该是1 / 3。但如果没有(3),则可能会发生P A c未定义的情况。那太奇怪了。在补充和柯尔莫哥洛夫公理关闭让我们说这样的话P 一个C ^= PP(A)=2/3P(Ac)1个/3P一种CP一种一种C=P一种+1个-P一种=1个

最后,我们正在考虑有关事件,所以我们还需要Ω &Element; ˚FΩΩF

好消息:代数仅对于不可数的集合是严格必要的σ

但!这里也有个好消息。或者至少是一种解决问题的方法。如果我们在基数不可数的集合中工作,则仅需要代数。如果我们限制可数集,那么我们可以采取˚F = 2 Ω的幂集Ω,我们不会有任何的这些问题,因为可数Ω2 ΩσF=2ΩΩΩ2Ω只包括测集。(这是在西安的第二条评论中提到的。)您会注意到,有些教科书实际上在这里确实有些微不足道,并且在讨论概率空间时仅考虑可数集。

此外,在中的几何问题中,仅考虑由定义了L n度量的集合组成的σ-代数就足够了。接地此稍微更牢固,大号 ÑÑ = 1 2 3对应于长度,面积和体积的通常概念。因此,在上一个示例中,我要说的是,该集合需要有一个定义明确的区域,才能为其分配几何概率。原因是:如果我们接受不可测量的集合,那么我们可能会遇到这样的情况,即我们可以根据某种证据将概率1分配给某个事件,将概率0分配给某个事件。[RñσLnLnn=1,2,3基于其他证据的同一事件事件。

但是不要让与不可数集的连接使您感到困惑!一个普遍的误解,认为代数是可数集。实际上,它们可能是可数的或不可数的。考虑一下这个插图:和以前一样,我们有一个单位正方形。定义F = 具有定义的L 2  度量的单位正方形的所有子集 可以得出一个正方形边长小号所有š 0 1 ,并与一个角在0 0 σ

F=All subsets of the unit square with defined L2 measure.
Bss(0,1)(0,0)。应该清楚的是,这个正方形是单位正方形的子集。而且,所有这些正方形都有定义的面积,因此这些正方形是元素。但也应该清楚的是,有不计其数的正方形B:这样的正方形的数目是不可数的,并且每个正方形都定义了Lebesgue测度。FB

因此,实际上,简单地进行观察通常足以使您认为仅考虑Lebesgue可测量的集合就可以解决感兴趣的问题。

但是等等,什么是不可测量的集合?

恐怕我自己只能对此有所了解。但是Banach-Tarski悖论(有时称为“太阳和豌豆”悖论)可以帮助我们:

给定3维空间中的实心球,球会分解为有限数量的不相交的子集,然后可以用不同的方式将其放回去,以产生原始球的两个相同副本。实际上,重新组装过程仅涉及移动零件并旋转零件,而无需改变其形状。但是,从通常的意义上讲,这些片段本身不是“实体”,而是点的无限散布。重建工作最少可以进行五次。

该定理的更强形式表示,给定任意两个“合理”实体(例如小球和大球),则可以将其中一个重新组装为另一个。这通常被非正式地称为“豌豆可以切碎并重新组装成太阳”,并被称为“豌豆和太阳悖论”。1个

因此,如果您正在使用概率,并且正在使用几何概率度量(体积比),则需要计算出某个事件的概率。但是您将很难精确地定义该概率,因为您可以重新排列空间集以更改体积!如果概率取决于体积,并且您可以将集合的体积更改为太阳的大小或豌豆的大小,那么概率也会改变。因此,任何事件都不会归因于此。更糟的是,你可以重新排列小号&Element; Ω,使得体积小号V 小号> V Ω R3SΩSV(S)>V(Ω),这意味着几何概率测度报告了概率,这是对Kolmogorov公理的公然违反,该公理要求该概率具有度量1。P(S)>1

为了解决这一矛盾,可以做出以下四个让步之一:

  1. 旋转时,一组的音量可能会改变。
  2. 两个不相交集的并集的体积可能与其体积之和不同。
  3. Zermelo–Fraenkel集合论的公理和选择公理(ZFC)可能需要更改。
  4. 一些集合可能被标记为“不可测量”,并且在谈论其数量之前,需要检查集合是否“可测量”。

选项(1)不能帮助使用定义概率,因此不存在。选项(2)违反了第二个Kolmogorov公理,因此退出了。选项(3)似乎是一个可怕的主意,因为ZFC可以解决比其创建的问题多得多的问题。但是选项(4)似乎很有吸引力:如果我们发展一种关于可测量和不可测量的理论,那么在这个问题上我们将具有明确的概率!这将我们带回到度量理论上,而我们的朋友便是代数。σ


5
谢谢您的回答。代表Lebesque可衡量吗?我会为您对信仰的回​​答+1,但是如果您可以将数学水平降低几个等级,我将不胜感激... :-)大号
Antoni Parellada

7
(+1)好点!我还要补充一点,如Borel-Kolmogorov悖论所示,在没有度量和代数的情况下,不可数空间上的条件分布和条件分布会变得很毛茸茸。σ
2013年

2
@西安感谢您的客气话!这真的很重要,来自您。在撰写本文时,我对Borel-Kolmogorov悖论还不熟悉,但是我会做一些阅读,看看是否可以对我的发现进行有益的补充。
Sycorax

3
@ Student001:我想我们在这里劈头发。没错,“度量”(任何度量)的一般定义是使用sigma代数的概念给出的。但是,我的观点是,在我的第一个链接中提供的勒贝格测度的定义中没有“西格玛-代数”的词或概念。换句话说,可以按照我的第一个链接定义 Lebesgue度量,但是随后需要证明这是一个度量,这是最困难的部分。我同意我们应该停止讨论。
变形虫

3
我非常喜欢阅读您的答案。我不知道如何感谢您,但是您已经做了很多澄清!我从未研究过真正的分析方法,也没有对数学进行适当的介绍。来自电气工程领域,他的工作重点是实际实施。您已经用这么简单的术语写过文章,以至于像我这样的家伙都能理解。非常感谢您的回答以及您所提供的简单性。也感谢@西安的一番评论!
Zushauque

19

基本思想(很实用)很简单。假设您是从事某些调查工作的统计学家。让我们假设调查大约有一些年龄问题,但只要求被申请人,以确定他的年龄在某个给定的时间间隔,如。让我们忘记其他问题。该调查表定义了一个“事件空间”,您的Ω F 。sigma代数F[0,18),[18,25),[25,34),(Ω,F)F编纂可以从调查表来获得所有的信息,所以,对于该年龄的问题(和现在我们忽略所有其它问题),它将包含间隔而不是其他的时间间隔等[ 20 30 ,由于通过问卷调查,我们不能回答这样的问题获得的信息:做受访者年龄都属于[ 20 30 或不?更一般而言,当且仅当我们可以确定采样点是否属于该集合时,集合才是事件(属于F)。[18,25)[20,30)[20,30)F

现在,让我们用第二个事件空间值定义随机变量。例如,将其作为与普通(桶形)西格玛代数的实线。然后,一个不是随机变量的(无趣的)函数是f “受访者年龄是素数”,如果年龄是素数,则将其编码为1,否则编码为0。不,f 11 不属于F,因此f不是随机变量。原因很简单,我们不能从调查表中的信息中确定被调查者的年龄是否适龄!现在,您可以自己制作更多有趣的示例。 (Ω,F)f:f1(1)Ff

为什么我们要求是sigma代数?假设我们要问两个数据问题,“被调查者3是18岁或更大”,“被调查者3是女性”。让问题定义两个事件(F中的集合)AB,这两个采样点集合给出对该问题的“是”答案。现在,让我们问两个问题的结合:“回答3是18岁或以上的女性”。现在,问题是由交集表示。以类似的方式,析取由并集表示FFABABAB。现在,要求对可数的相交和并集要求封闭性,这使我们可以求出可数的合取或析取。并且,否定问题由互补集表示。这给了我们一个西格玛代数。

我首先在彼得·惠特尔(Peter Whittle)的一本非常不错的书《通过期望的概率》(施普林格)中看到了这种介绍。

编辑

试图在评论中回答胡扯的问题:“但是,当我遇到这样的断言时,我最后有些吃惊:'要求可数的交集和并集的封闭性让我们问可数的合取或析取。” 这似乎是问题的核心:为什么有人要构造这样一个无限复杂的事件?为了方便起见,现在将自己限制为离散概率,例如抛硬币。投掷硬币一定次数,我们可以使用硬币描述的所有事件都可以通过以下类型的事件表示:“ head on throw ”,“ tails throw i ”以及有限数量的“ and”或“ or”因此,在这种情况下,我们不需要σiiσ-代数,集合的代数就足够了。那么,在这种情况下,是否存在代数出现的情况?在实践中,即使我们只能掷骰子有限次,但当掷骰数n无限增长时,我们也会通过极限定理来开发概率的近似值。因此,请看一下这种情况的中心极限定理的证明,即Laplace-de Moivre定理。我们可以通过仅使用代数的逼近来证明,不需要σ-代数。大数的弱定律可以通过切比雪夫不等式证明,为此,我们只需要计算有限n个情况下的方差即可。但是,对于强大的大数定律σnσn,我们证明有概率的事件只能通过无数个“与”和“或”来表示,因此对于强大的大数定律,我们需要代数。 σ

但是,我们真的需要强大的大数定律吗?根据这里的一个答案,也许不是。

从某种意义上说,这表明大数定律和弱定律之间存在很大的概念差异:强定律没有直接的经验意义,因为它与实际收​​敛有关,而这永远无法进行经验验证。另一方面,弱定律是关于近似质量随着增加而增加的,数值范围为n,因此在经验上更有意义。nn

σ


4
σP(A)[20,30)P(A)[20,30)P(A)[18,34)定义明确,因此甚至不清楚该示例是否说明了您想要的内容。
Sycorax'3

5
我们不需要“σσ

2
σ

3
我认为您的论点是正确的。最后,当我遇到这样的断言时,我有些吃惊:“要求可数的交叉点和联合的封闭性,让我们可以求出可数的连接或析取”。这似乎是问题的核心:为什么有人要构造这样一个无限复杂的事件?一个很好的答案将使您的其余帖子更有说服力。
ub

2
实际用途:金融数学中的概率和测度理论(包括随机微分方程,伊藤积分,代数过滤等)似乎没有sigma代数就不可能。(由于我已经对您的回答进行了投票,因此我无法对所做的修改进行投票!)
更糟

1

σ

σAB(AB)C

第一个公理是∅,𝑋∈𝜎。好吧,您始终知道什么也没发生(0)或什么事情发生(1)的可能性。

第二个公理在补码下是封闭的。让我提供一个愚蠢的例子。同样,考虑使用𝑋= {𝐻,𝑇}的硬币翻转。假装我告诉你,此翻转的𝜎代数是{∅,𝑋,{𝐻}}。就是说,我知道什么都没发生的概率,什么事情发生的概率以及发生正面的概率,但是我不知道发生末端的概率。你会正确地称我为白痴。因为如果您知道正面的概率,您就会自动知道正面的概率!如果您知道某事发生的可能性,那么您就知道该事没有发生的可能性(补码)!

最后一个公理在可数联合下是封闭的。让我再举一个愚蠢的例子。考虑骰子的滚动,或𝑋= {1,2,3,4,5,6}。如果我要告诉你的𝜎代数是{∅,𝑋,{1},{2}}。也就是说,我知道滚动1或滚动2的概率,但我不知道滚动1或2的概率。同样,您有理由将我称为白痴(我希望原因很清楚)。当集合不相交时会发生什么,而无法计数的联合会发生什么,则有些混乱,但我希望您可以尝试考虑一些示例。

σ

嗯,这不是一个完全干净的案例,但是有一些可靠的原因

为什么概率论者需要采取措施?

σσ代数。您可能还需要P

人们带来了Vitali的场景和Banach-Tarski来解释为什么需要量度理论,但是我认为那是 具有误导性。Vitali的集仅适用于平移不变的(非平凡的)度量,而概率空间不需要。Banach-Tarski需要旋转不变性。分析人们关心他们,但概率论者实际上并不关心。

存在理由在概率理论测度论的是统一离散和连续RV的处理,而且,允许该混合提那种既不的RV和的RV。


σσ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.