我正在寻找一些不适合使用Poisson分布进行建模的情况的好例子,以帮助我向学生解释Poisson分布。
通常可以使用一个时间间隔内到达商店的顾客数量作为示例,该示例可以通过泊松分布进行建模。我正在寻找类似的反例,即这种情况可以视为连续时间内的正计数过程,而这显然不是泊松。
理想情况下,情况应尽可能简单明了,以使学生易于掌握和记住。
我正在寻找一些不适合使用Poisson分布进行建模的情况的好例子,以帮助我向学生解释Poisson分布。
通常可以使用一个时间间隔内到达商店的顾客数量作为示例,该示例可以通过泊松分布进行建模。我正在寻找类似的反例,即这种情况可以视为连续时间内的正计数过程,而这显然不是泊松。
理想情况下,情况应尽可能简单明了,以使学生易于掌握和记住。
Answers:
一段时间内吸烟的数量:这需要零膨胀过程(例如,零泊松或零负二项式膨胀),因为不是每个人都抽烟。
您是说正计数数据吗?无界?
负二项式很流行。
另一个好的模型是0的Poisson。该模型假定正在发生某种事情或没有发生-如果发生,则遵循Poisson。我最近看了一个例子。询问治疗艾滋病患者的护士,由于他们参与了艾滋病患者,他们多久受到他人的侮辱行为。许多人从未有过这样的经历,可能是因为他们在哪里工作或居住。在那些做过的事情中,受到侮辱的次数有所不同。报告的0数比直接的Poisson所期望的要多,这主要是因为所研究的小组中有一定比例的人根本不在处于使他们遭受此类行为影响的环境中。
泊松混合也可以为您提供积分过程。
计数不是泊松的过程吗?好吧,任何有限的样本空间过程,例如二项式或离散均匀。通过对具有独立的到达时间并呈指数分布的事件进行计数,可以得到一个泊松计数过程,因此,可以得到大量的归纳总结,例如具有gamma或对数正态或Weibull分布的到达时间,或任何抽象的非参数到达时间分配。
尚不清楚是否要计数进程。
如果我将“教学”标签解释为意味着您正在讲授Poisson过程,那么对于一般过程的讲授,伯努利过程是一个易于解释和可视化的随机过程,与Poisson过程有关。伯努利过程是离散的模拟,因此它可能是一个有用的伴随概念。只是没有连续的时间,而是有离散的时间间隔。
一个例子就是门到门的推销员,我们在这里通过购买房屋来计算成功的次数。
这就是Bertsekas和Tsitsiklis在《概论》(第二版)中使用的方法,该方法在泊松过程之前介绍了伯努利过程。在他们的教科书中,有更多适用于Poisson流程的Bernoulli流程扩展,例如合并或分区,以及解决方案中的问题集。
如果您正在寻找随机过程的示例,并且只想把名字扔在那里,那么有很多。
高斯过程在应用中是一个重要的过程。特别是Weiner过程,它是高斯过程的一种,也被称为标准布朗运动,在金融和物理学中都有应用。
作为财产/伤亡保险精算师,我处理的都是离散过程的真实示例,这些过程一直都是非泊松过程。对于高强度,低频业务线,泊松分布不合适,因为它要求方差均值为1。上面提到的负二项式分布更常见,而德拉波特分布在某些文献中使用了,尽管在标准的北美精算实践中很少使用。
为什么会这样是一个更深层次的问题。负二项式是否更好,因为它表示均值本身是伽马分布的泊松过程?还是因为损失的发生使独立性失败(如当前理论中的地震事件那样,人们等待地球滑坡的时间越长,就越有可能是由于压力的积累),它是否是平稳的(时间间隔不能细分为序列,每个序列都是固定的,这将允许使用非均质的Poisson),当然,某些业务范围也允许同时发生(例如,医疗事故导致多名医生受此政策保护)。
其他人提到了点过程的几个非泊松例子。因为如果您选择任何非指数的到达时间分布,则泊松对应于指数到达时间,因此所得的点过程不是泊松。AdamO指出了威布尔犬。您可以使用gamma,对数正态或beta作为可能的选择。
泊松具有其均值等于其方差的性质。方差大于均值的点过程有时称为过度分散,如果均值大于方差,则表示欠分散。这些术语用于使过程与泊松相关。通常使用负二项式,因为它可以根据其参数而过度分散或分散不足。
泊松具有恒定的方差。除不具有恒定速率参数,因此不随时间变化的均值和方差之外,符合泊松条件的点过程称为不均匀泊松。
到达时间为指数但在到达时间可能有多个事件的过程称为复合泊松。尽管与泊松过程相似,并且名称中带有泊松一词,但非均质复合泊松过程与泊松点过程不同。
非泊松计数过程的另一个有趣示例是零截断泊松分布(ZTPD)。ZTPD可以拟合有关受试者在生理条件下可以说的语言数量的数据。在这种情况下,泊松分布表现不佳,因为口头语言的数量定义为> = 1:因此先验排除了0。
您可能需要重新考虑足球示例。看起来随着比赛的进行,两支球队的得分率都在增加,并且当球队根据当前得分改变进攻/防守优先级时,他们的得分也会改变。
或者更确切地说,以它为例,其简单模型的表现出人意料地出色,激发了对某种现象进行统计研究的兴趣,并为将来的研究提供了基准,以收集更多数据以研究差异并提出详细建议。
Dixon&Robinson(1998),“协会足球比赛的出生过程模型”,统计学家,第47页,第3页。
由于问题与使Poisson分布更易于理解有关,因此我将一事无成,因为我最近在某种程度上针对呼叫中心传入呼叫模式进行了研究(随着时间的流逝,该模式遵循无内存,指数分布)。
我认为深入研究另一种切向模型(该模型本质上需要泊松知识来认识它不是一个模型)可能会有些令人困惑,但这就是我。
我认为了解Poisson的麻烦在于它是连续的时间轴---每隔一秒钟就会发生一次,事件不再可能发生---但是随着您走得越远,就越确定发生。
的确,如果您仅将“时间”轴替换为“试验”或“事件”,我认为这会简化理解。
如果我认为这是一个简单的解释,那么有人可以纠正我,因为我认为这是一个简单的解释,但是我认为您可以用“直到电话到达的时间”代替硬币的掷骰或掷骰子。通常用于Erlang C /呼叫中心人员)。
您可以将其替换为“滚动直到骰子打到六个”,而不是“直到打个电话到达的时间”。
这遵循相同的一般逻辑。概率(像任何赌博一样)在每一卷(或每一分钟)内都是完全独立的,并且没有记忆。但是,随着试验次数的增加,“否6”的可能性会越来越慢,但肯定会接近0。如果您同时看到两个图表,则通话会更容易(通话的可能性随时间变化,而滚动的可能性为6)。
我不知道这是否有意义---这就是帮助我将其组合成具体术语的原因。现在,泊松分布是一个计数,而不是“两次通话之间的时间”或“直到滚动六次的尝试时间”,但它依赖于这种可能性。
在给定的时间间隔内,单个客户访问杂货店的次数。
到杂货店后,除非您犯了计划错误,否则您不太可能会回来一段时间。
我认为这里可以使用负二项式分布,但它是离散的,而访问是连续的时间。