连续随机变量取固定点的概率


11

我正在介绍性统计课程中,其中连续随机变量的概率密度函数已定义为。我知道的积分,但是我不能凭直觉来对这一点进行纠正。假设X是随机变量,等于从火车到达时间t开始的分钟数。我如何计算火车从现在开始准确到达5分钟的概率?这个概率如何为零?不可能吗 如果火车确实从现在起5分钟后到达,怎么办呢,如果概率为0,怎么办?一个 ˚F X d X = 0P{XB}=Bf(x)dxaaf(x)dx=0

谢谢。


2
将其中一些问题放在他们的头上会很有帮助。 例如,如果您的直觉表明每个可能的时间都必须具有一定严格的正概率,那么-因为在任何时间间隔中都有一组不可数的可能时间-您的直觉意味着总概率是无限的。显然,直觉是错误的。必须放弃的一件事是,概率为零意味着不可能的想法:那是不正确的。同样,概率为1并不意味着确定。
ub

@whuber这是我无法纠正的问题。如果事件发生的概率为0,则永远都不会发生。例如,如果我有一个标准的六面骰子,则我掷出任何数字的概率为0,因此将永远不会发生。此外,在随后的实验中如何不能确定概率为1的事件?你能举个例子吗?Z{1,2,3,4,5,6}
geofflittle

1
假设您看到一个圆,其中显示了一个和弦,并且看起来像是一个直径,提示您想知道“随机选择的和弦不是直径的机会是什么?” 通过沿圆周均匀且独立地选择一对点来获得和弦时,答案为,但未发生此事件。这提供(相当强!)证据表明和弦不是您所放置的随机过程的结果。这样的思想实验提供的一个教训是,基于有限概率空间的直觉并不总是可以概括的。1
ub

Answers:


8

您可能陷入将“从现在开始的五分钟”持续一段有限的时间(这将是非零概率)的陷阱。

连续变量意义上的“从现在开始的五分钟”是真正的瞬时。

想象一下,下一班火车的到达时间是在8:00和8:15之间均匀分配的。进一步想像一下,我们将火车到达定义为火车的前方经过车站的特定点(如果没有更好的地标,则可能是平台的中点)。考虑以下概率顺序:

a)火车在8:05和8:10之间到达的概率

b)火车在8:05和8:06之间到达的概率

c)火车在8:05:00和8:05:01之间到达的概率

d)火车在8:05:00和8:05:00.01之间到达的概率(即,在百分之一秒的间隔内

e)火车在8:05至十亿分之一秒后到达的概率

f)火车在8:05到一秒的四十分之一之间到达的概率

... 等等

它恰好 8:05 到达的概率就是这样的一系列概率的极限值。概率小于每个。ϵ>0


我理解这一点,但是,假设火车已经到达,它会在某个时间点到达。为什么这个限制还不能收敛到某个概率?
geofflittle

如您所说,如果您理解它,则可以按照指示的方式计算概率。让我更容易:为计算方便起见,想象一下,火车在间隔(0,1)上以均匀分布的时间“到达”(但是我们定义它,只要它实际上是连续的)确切的时间(无论是一个方便的时间单位)。在间隔内的某个时刻,火车在时间之前到达的概率是多少?它在时间之后到达的概率是多少?它到达和之间的概率是多少?...(ctd)X X X X + d Xxxxxx+dx
Glen_b-莫妮卡(Monica

(CTD)......如果说这是到达时间 '为一个连续变量,表示“那是什么最后的概率为限那么,那是什么限制?工作了!这概率就收敛于该功能密切相关的是什么使一个连续的PDF连续。d x 0 xdx0?
Glen_b -Reinstate莫妮卡

另外请注意,如果最后的极限是什么,但零,你的三个概率(前,之后和“在”)不会增加1X Xxxx
Glen_b -Reinstate莫妮卡

5

如果火车确实从现在起5分钟后到达,怎么办呢,如果概率为0,怎么办?

概率陈述不是关于事件的可能性/可行性的陈述。它仅反映了我们试图量化不确定性的尝试。因此,当一种现象是连续的(或建模为一种现象)时,则我们的工具和当前的知识状态不允许我们以特定的值对该现象进行概率性陈述。我们只能做出与范围相关的声明价值。当然,这里的通常技巧是离散化支持,考虑值的“小”间隔而不是单个值。由于与离散随机变量相比,连续随机变量带来了巨大的好处和灵活性,因此,发现付出的代价相当小,也许与我们被迫考虑的间隔一样小。


这些陈述令人费解,也许是因为可以用许多不同的方式来解释它们。在某些地方,您似乎否认使用连续分布对现象建模的有效性-并在现象和模型之间做出了鲜明的区分-在其他地方,您似乎完全放弃了这种区分。我对此的阅读(我怀疑不是故意的)是,您认为对于任何连续RV,的数学事实实际上始终是错误的,但这似乎使您否认概率论的适用性!Pr(X=a)=0X
ub

2
嗨@whuber 关于模型和现象之间的区别,地球地图不是地球,但可以帮助您漫游地球。当我不将模型视为纯粹的智力乐趣的对象(它们也是)时,我就是这样思考模型的。至于“零概率”问题,这是一个缺陷-毕竟,拥有连续性的所有好处能够对单个值做出概率表述不是很好吗?但是,不完美当然不会使某些事情不适用,而且正如我所写的那样,这种不完美的重要性已被证明不那么重要。
Alecos Papadopoulos

您隐式地认为概率是映射类比中“存在”的一些客观事物,但事实并非如此。概率仅在模型内具有含义。我认为概率公理中没有“缺陷”,而且确实可以对单个值的概率做出准确,一致的陈述:通常为零。
whuber

2
@whuber不,我不这么认为,而且我不明白您在我写的文章中从哪看到的。我说过“地图不是地球”,这意味着“模型中的内容在现实中不存在”,那么如何从中得出相反的结论呢?“不完美”并不是指概率公理,而是指这些公理引导我们使用什么工具,以及如何有效地使用这些工具来建模,研究和理解现实世界。很明显,我相信概率是一种有效的工具。
Alecos Papadopoulos

4

为了使您对上面有一些直观的认识,请尝试以下(经过思考的)实验:

用尺子在零附近画一条实线。现在,拿一个锋利的飞镖,让它从上方随机掉到直线上(假设您总是打直线,并且为了论证,只有横向位置很重要)。

但是,如果您多次使飞镖随机掉线,您将永远不会达到零点。为什么?考虑什么是零点,考虑其零点宽度。当您知道它的宽度为0之后,您是否仍然认为可以击中它?

您能否达到第1点或-2?还是您为此选择了其他观点?

回到数学,这是物理世界与诸如实数之类的数学概念(在我的示例中以实线表示)之间的区别。概率理论对概率的定义要比您在讲座中看到的复杂得多。要量化事件及其结果的任意组合的概率,您需要一种概率度量。两者Borel测度勒贝格测度是针对区间[a,b]上对实体线所限定: 从这一定义可以看到如果减少的间隔什么与概率发生到一个数字(设置a = b)。

μ([a,b])=ba

最重要的是,根据我们对概率论的当前定义(可以追溯到科尔摩哥罗夫),事件具有0概率的事实并不意味着该事件不会发生。

就您的火车示例而言,如果您拥有无限精确的手表,您的火车将永远不会准时到达。


您说“永远不会达到零点”,但是您能说我第一次飞镖击中的点是什么?令为我要指出的重点。在扔我的飞镖之前,您可能会说“您永远不会达到点”,但我只是击中了它。怎么办?Xxx
geofflittle

我认为您必须区分以下问题:我达到某个点的概率是多少?如果我们同意您始终投掷飞镖并且始终击中某条线,则该概率为1。此外,我并不是说您不会击中0。我是说您击中任何点的概率前投掷飞镖是0。事实上,你可以选择任何有限集合点的概率仍然是0
手段-这意味着

关于你的问题,我明白你的意思,但是问事件发生后的概率是没有意义的。诸如P(X = x)之类的语句指的是随机变量X的未来实现。因此,当您遇到问题后,我将不再赘述。(大写字母仅用于指出时间流,而不是大喊……)
意思是指

1

概率分布必须具有单位面积。如果度量是连续的,则可以采用无数个值(即沿分布x轴的无数个值)。概率分布的总面积可以有限的唯一方法是使无穷多个值中的每个值都为零。一除以无限。

在“现实生活”中,不可能有采用无穷多个值的度量(通过几种在这里无关紧要的不同哲学论据),因此没有值需要采取恰好为零的概率。一个有用的实用论据是基于实际测量的有限精度。如果您使用的秒表的长度为十分之一秒,那么火车将有十分之一秒的时间“恰好”在五分钟内到达。


3
尽管演绎步骤不正确,但第一段提供了一些模糊的直觉。有许多分布可以接受无限数量的值,但是每个值都具有严格的正概率。第二段可能会从重新措辞中受益,该措辞强调指出,与每个度量值相关联的是基础关注数量的可能值的(较小)间隔。
红衣主教

在这种情况下,严格的正值(有限值除以无穷大)与零之间有什么区别?
Michael Lew

2
我的观点可能做得不好,是因为第一段中的论点是基于这样一个错误的前提:由于随机变量可以具有无限多个值,因此每个结果的概率必须为零。当然,这是不正确的(泊松,几何等);“无限”的概念在这里还不够强大,我们要求不可数
主教

0

其他人已经回答了为什么概率为零(如果您将时间近似为连续的时间,实际上实际上不是,但是无论如何...),所以我将简单地回声一下。为了回答OP提出的最后一个问题-“如果概率为0怎么会发生?”- 如果概率为零,就会发生很多事情。概率为零的所有集合意思是,在可能发生的可能事物的空间中,集合不占空间。就这些。没有比这更有意义的了。AA

我写这篇文章的目的是希望解决OP在评论中所说的其他问题:

您说“永远不会达到零点”,但是您能说我第一次飞镖击中的点是什么?让𝑥成为我要说的重点。在扔我的飞镖之前,你会说“你永远不会达到the”,但我只是达到了。怎么办?

这是一个非常好的问题,当我开始了解概率时,我就开始努力。答案是:这不等于您最初提出的问题!您要做的是花时间进行分析,这意味着潜在的概率结构发生了变化,变得更加复杂。这是您需要知道的。概率空间由三部分组成:基础空间,例如或;该空间上所有可能结果的集合,例如上所有半开间隔的集合,以及满足的度量(Ω,A,μ)ΩRZRμμ(Ω)=1。您最初的问题存在于空格 ,其中 是Lebesgue度量(这意味着)。在此空间中,由于上述原因,您击中任何单个点的概率为零-我想我们已经解决了这一问题。但是现在,当您说上述引用的段落时,您正在定义一个称为过滤的东西,我们将其写为。一般而言,过滤是对所有都满足的子集的集合([a,b],all half open intervals on [a,b],ν)νν([c,d))=1dcx[a,b]˚F={˚F}0˚F˚F小号<小号˚F={X[b]镖命中 X 在时间 '<}˚F1F={Ft}t0AFtFst<s。在您的情况下,我们可以定义过滤 现在,在您的结果空间的这个新子集中,猜猜是什么-您说对了!您已经击中它,并且在第一次抛出之后,如果限于过滤则达到该点的概率为1。

Ft={x[a,b]:dart hit x at time t<t}.
F1


因为您使用的是技术语言,所以最好为这些术语采用标准含义。特别是,您所谓的“结果”通常被称为(基本)事件:结果是的要素 您的(标准化)Lebesgue测度公式不正确:我怀疑您打算使用 从更基本的角度来看,不清楚为什么您需要调用随机过程的机制来讨论对单个事件的时间进行建模的随机变量,也不清楚这是否能提供任何见解。ν [ c d ] = d - c /b - a Ω.ν([c,d])=(dc)/(ba).
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.