我正在尝试对火车到达时间的一些数据进行建模。我想使用一个分布来捕获“我等待的时间越长,火车出现的可能性就越大”的分布。这样的分布看起来应该像CDF,这样P(火车出现|等待60分钟)接近1。
我正在尝试对火车到达时间的一些数据进行建模。我想使用一个分布来捕获“我等待的时间越长,火车出现的可能性就越大”的分布。这样的分布看起来应该像CDF,这样P(火车出现|等待60分钟)接近1。
Answers:
在t到t + d t(等待时间)之间的时间首次到达的概率等于
后一个术语与:
要么
给予:
等待时间的概率分布为:
或者,您可以将表达式用于小于一个到达时间为t的条件的概率
在时间和之间到达的概率等于导数
例如,该方法/方法可用于推导伽马分布作为泊松过程中第n次到达的等待时间。(泊松过程的等待时间遵循伽马分布)
您可能将此与等待中的悖论相关(请解释等待中的悖论)。
指数分布:如果像泊松过程那样到达是随机的,则是常数。下一次到达的概率与上一个没有到达的等待时间无关(例如,如果您多次掷骰子而不掷6个骰子,那么对于下一个掷骰,您突然不会有更高的6个概率,请看赌徒的谬误)。 。您将获得指数分布,并为等待时间的概率密度函数为:
恒定分布:如果到达是以恒定速率发生的(例如火车按照固定的时间表到达),那么当一个人已经等待了一段时间时,到达的可能性就会增加。说列车应该每到分钟的频率然后,后已经等待分钟是和等待时间将是PDF:
因此,与您的问题有关的第二种情况是“然后,当一个人已经等待了一段时间时到达的可能性增加了”。
根据您的情况,可能需要进行一些调整。有了更多的信息,火车在某一时刻到达的概率可能是一个更复杂的函数。