非泊松过程的例子?


15

我正在寻找一些不适合使用Poisson分布进行建模的情况的好例子,以帮助我向学生解释Poisson分布。

通常可以使用一个时间间隔内到达商店的顾客数量作为示例,该示例可以通过泊松分布进行建模。我正在寻找类似的反例,即这种情况可以视为连续时间内的正计数过程,而这显然不是泊松。

理想情况下,情况应尽可能简单明了,以使学生易于掌握和记住。


5
这个问题异常广泛。除非缩小范围并添加更多上下文,否则很可能最终关闭。没有听起来不必要的刺耳的含义,这就像在问:“有哪些非红色花朵的例子?” (提示哈里·查平。)
红衣主教2012年

1
点了。我很抱歉。我应该更具体一些。我对其进行了编辑,以使其更加清晰。
内格尔

1
(+1)提问和评论。更新要好得多。:-)
主教

2
我假设您的意思是“给定的过程,人们可能至少会天真的将其视为泊松”(例如,至少是计数过程)。一个常见的例子是,由于多种可能的因素,一般保险(P&C保险)保单的理赔数量出现了变化,最明显的体现是理赔率的异质性-因此存在强度不同的Poisson流程的叠加。在索赔率的分布很好地由伽玛分布近似的情况下,索赔计数的分布又由负二项式近似。
Glen_b-恢复莫妮卡2014年

Answers:


5

一段时间内吸烟的数量:这需要零膨胀过程(例如,零泊松或零负二项式膨胀),因为不是每个人都抽烟。


谢谢!这里许多人提到零膨胀过程,但我认为这是给出的最直接和最说明性的示例:一段时间内随机挑选的人吸烟的香烟数量。
内格尔2014年

这里可以说是同一个全民情敌“不是每个人都抽香烟”的说法,不过,在那你可以声称,这个过程仍然是泊松,只是强度参数是具体到每个人的和未知的(非吸烟者将有一个非常小的强度)-对吗?但是,也可能会认为这种情况违反了Poisson的假设,即抽烟的香烟倾向于在一天中(对于普通吸烟者)或整群烟(对于社会吸烟者)均匀地散开,因此不连续的时间间隔不是独立的。我认为,这仍然是一个很好的例子。
Nagel 2014年

1
我认为一段时间内捕获的鱼的数量是ZIP和ZINB的一个更典型的例子。类似的论点。尽管鱼类没有对食用率产生上瘾作用的潜力。(我知道,我知道,除了你妈妈的鱼,因为他们都认为不错:)。
Alexis 2014年

8

您是说正计数数据吗?无界?

负二项式很流行。

另一个好的模型是0的Poisson。该模型假定正在发生某种事情或没有发生-如果发生,则遵循Poisson。我最近看了一个例子。询问治疗艾滋病患者的护士,由于他们参与了艾滋病患者,他们多久受到他人的侮辱行为。许多人从未有过这样的经历,可能是因为他们在哪里工作或居住。在那些做过的事情中,受到侮辱的次数有所不同。报告的0数比直接的Poisson所期望的要多,这主要是因为所研究的小组中有一定比例的人根本不在处于使他们遭受此类行为影响的环境中。

泊松混合也可以为您提供积分过程。


(+1)表示零膨胀的Poisson分布。可以在此处

1
对此(以及其他答案)的+1提供了问题中提到的情况的实际示例,而不仅仅是抽象分布。ZIP的这个例子特别清楚。
ub

1
在回答这些问题的人中,我应该指出,我的问题起初过于草率,根本没有提到任何情况。我同意零膨胀泊松就是一个很好的例子。但是,我发现要讲给本科生讲的内容太复杂了,因此我仍然缺少一些简单情况的例子,这些例子无法用泊松分布来建模。
Nagel 2012年

4

计数不是泊松的过程吗?好吧,任何有限的样本空间过程,例如二项式或离散均匀。通过对具有独立的到达时间并呈指数分布的事件进行计数,可以得到一个泊松计数过程,因此,可以得到大量的归纳总结,例如具有gamma或对数正态或Weibull分布的到达时间,或任何抽象的非参数到达时间分配。


多谢您的回覆,很抱歉我的问题起初不清楚。我已经澄清了。您对具有非指数和/或相关到达间隔时间的过程的看法是有道理的,但是您是否有任何具有这些属性的情况的例子,越简单越好?
Nagel 2012年

4
你打赌!两次疱疹病毒爆发之间的时间。最初爆发的时间更长,因为您实际上必须感染该病毒。此后两次爆发之间的间隔时间是相互独立的,但相对于指数爆发而言速度要快得多。非指数间隔到达时间是正常的。在生存分析中,一种常用的分析方法是Cox比例危害模型,您可以在其中删除有关到达时间的任何参数假设。
2012年

好的例子!我猜这是上面Placidia提到的零膨胀泊松的另一种情况?
Nagel 2012年

4

尚不清楚是否要计数进程。

如果我将“教学”标签解释为意味着您正在讲授Poisson过程,那么对于一般过程的讲授,伯努利过程是一个易于解释和可视化的随机过程,与Poisson过程有关。伯努利过程是离散的模拟,因此它可能是一个有用的伴随概念。只是没有连续的时间,而是有离散的时间间隔。

一个例子就是门到门的推销员,我们在这里通过购买房屋来计算成功的次数。

  • 前n次试验的成功次数具有二项式
    分布B(n,p)而不是泊松
  • 获得r成功所需的试验次数具有负二项式分布NB(r,p)而不是伽玛分布
  • 获得成功所需的试验次数(等待时间)具有几何分布NB(1,p),这是指数的离散模拟。

这就是Bertsekas和Tsitsiklis在《概论》(第二版)中使用的方法,该方法在泊松过程之前介绍了伯努利过程。在他们的教科书中,有更多适用于Poisson流程的Bernoulli流程扩展,例如合并或分区,以及解决方案中的问题集。

如果您正在寻找随机过程的示例,并且只想把名字扔在那里,那么有很多。

高斯过程在应用中是一个重要的过程。特别是Weiner过程,它是高斯过程的一种,也被称为标准布朗运动,在金融和物理学中都有应用。


多谢您的回覆,很抱歉我的问题一开始是现成的,不清楚。我现在试图澄清它。从Bernoulli到Poisson的链接很有趣,但是我正在寻找的是连续时间内不适合用Poisson分布建模的情况的示例,越简单越好。
Nagel 2012年

3

作为财产/伤亡保险精算师,我处理的都是离散过程的真实示例,这些过程一直都是非泊松过程。对于高强度,低频业务线,泊松分布不合适,因为它要求方差均值为1。上面提到的负二项式分布更常见,而德拉波特分布在某些文献中使用了,尽管在标准的北美精算实践中很少使用。

为什么会这样是一个更深层次的问题。负二项式是否更好,因为它表示均值本身是伽马分布的泊松过程?还是因为损失的发生使独立性失败(如当前理论中的地震事件那样,人们等待地球滑坡的时间越长,就越有可能是由于压力的积累),它是否是平稳的(时间间隔不能细分为序列,每个序列都是固定的,这将允许使用非均质的Poisson),当然,某些业务范围也允许同时发生(例如,医疗事故导致多名医生受此政策保护)。


2

其他人提到了点过程的几个非泊松例子。因为如果您选择任何非指数的到达时间分布,则泊松对应于指数到达时间,因此所得的点过程不是泊松。AdamO指出了威布尔犬。您可以使用gamma,对数正态或beta作为可能的选择。

泊松具有其均值等于其方差的性质。方差大于均值的点过程有时称为过度分散,如果均值大于方差,则表示欠分散。这些术语用于使过程与泊松相关。通常使用负二项式,因为它可以根据其参数而过度分散或分散不足。

泊松具有恒定的方差。除不具有恒定速率参数,因此不随时间变化的均值和方差之外,符合泊松条件的点过程称为不均匀泊松。

到达时间为指数但在到达时间可能有多个事件的过程称为复合泊松。尽管与泊松过程相似,并且名称中带有泊松一词,但非均质复合泊松过程与泊松点过程不同。


多谢您的回覆,很抱歉我的问题一开始是现成的,不清楚。我现在试图澄清它。您提到了具有非指数和/或相关的到达时间的过程,您对分散过度和分散不足的说法非常有趣,但是您是否有任何具体实例具有这些属性?越简单越好:)
Nagel 2012年

1
我认为您可以在书中找到许多有关计数过程的例子,而不是尝试给出自己的答案。我建议您看一下乔·希尔伯(Joe Hilbe)关于负二项式回归的书。
Michael R. Chernick 2012年

2

非泊松计数过程的另一个有趣示例是零截断泊松分布(ZTPD)。ZTPD可以拟合有关受试者在生理条件下可以说的语言数量的数据。在这种情况下,泊松分布表现不佳,因为口头语言的数量定义为> = 1:因此先验排除了0。


2

我相信您可以采用两种方式来调整客户到达的Poisson流程:1)每天24小时测量客户的到来,但实际上商店并非全天营业; 2)想象两家竞争的商店泊松处理客户的到达时间,并查看两家商店的到达时间之间的差异。(示例2是我对Springer工程统计手册,A部分属性1.4的理解。)


1

您可能需要重新考虑足球示例。看起来随着比赛的进行,两支球队的得分率都在增加,并且当球队根据当前得分改变进攻/防守优先级时,他们的得分也会改变。

或者更确切地说,以它为例,其简单模型的表现出人意料地出色,激发了对某种现象进行统计研究的兴趣,并为将来的研究提供了基准,以收集更多数据以研究差异并提出详细建议。

Dixon&Robinson(1998),“协会足球比赛的出生过程模型”,统计学家,第47页,第3页。


我有一种直觉,那就是足球比赛并不完全是Poisson,但感谢您提供参考:)
Nagel

1

由于问题与使Poisson分布更易于理解有关,因此我将一事无成,因为我最近在某种程度上针对呼叫中心传入呼叫模式进行了研究(随着时间的流逝,该模式遵循无内存,指数分布)。

我认为深入研究另一种切向模型(该模型本质上需要泊松知识来认识它不是一个模型)可能会有些令人困惑,但这就是我。

我认为了解Poisson的麻烦在于它是连续的时间轴---每隔一秒钟就会发生一次,事件不再可能发生---但是随着您走得越远,就越确定发生。

的确,如果您仅将“时间”轴替换为“试验”或“事件”,我认为这会简化理解。

如果我认为这是一个简单的解释,那么有人可以纠正我,因为我认为这是一个简单的解释,但是我认为您可以用“直到电话到达的时间”代替硬币的掷骰或掷骰子。通常用于Erlang C /呼叫中心人员)。

您可以将其替换为“滚动直到骰子打到六个”,而不是“直到打个电话到达的时间”。

这遵循相同的一般逻辑。概率(像任何赌博一样)在每一卷(或每一分钟)内都是完全独立的,并且没有记忆。但是,随着试验次数的增加,“否6”的可能性会越来越慢,但肯定会接近0。如果您同时看到两个图表,则通话会更容易(通话的可能性随时间变化,而滚动的可能性为6)。

我不知道这是否有意义---这就是帮助我将其组合成具体术语的原因。现在,泊松分布是一个计数,而不是“两次通话之间的时间”或“直到滚动六次的尝试时间”,但它依赖于这种可能性。


我可以看到您如何认为这会使学生感到困惑,但是我的想法仅仅是,如果我有柜台,这将使我更容易解释为什么在一定时间间隔内到达餐厅的顾客数量是Poisson -具有连续时间离散事件而不是Poisson的简单过程的示例。
内格尔2014年

1
我认为有很多选择。一种明显的模式是事件随着事件的发生而增加或减少的事件。很难想到一些例子。也许蚂蚁到达您的厨房/野餐。第一只蚂蚁到达所花费的时间可能比第二或第三只蚂蚁要长得多,当然,更多的蚂蚁到达意味着未来的蚂蚁到达的可能性更大(假设它们的踪迹/彼此交流)。不知道这是否有价值。
约翰·巴布森

1

在给定的时间间隔内,单个客户访问杂货店的次数。

到杂货店后,除非您犯了计划错误,否则您不太可能会回来一段时间。

我认为这里可以使用负二项式分布,但它是离散的,而访问是连续的时间。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.