我不是程序员而是统计学家,所以我希望这个问题不要太幼稚。
它发生在随机执行的采样程序执行中。如果我对程序状态进行N = 10个随机时间采样,则可以看到函数Foo在例如这些采样中的I = 3上执行。我对这能告诉我有关Foo执行的实际时间F的时间感兴趣。
我知道我是二项分布的,均值F * N。我也知道,给定I和N,F遵循beta分布。实际上,我已经通过程序验证了这两个分布之间的关系,即
cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1
问题是我对这种关系没有直觉。我无法“想象”它为什么起作用。
编辑:所有答案都是具有挑战性的,尤其是@whuber,我仍然需要了解,但整理订单统计数据非常有帮助。尽管如此,我已经意识到我应该问一个更基本的问题:给定I和N,F的分布是什么?每个人都指出它是Beta,我知道。我终于从维基百科(先前的共轭)中弄清楚了Beta(I+1, N-I+1)
。使用程序进行探索之后,这似乎是正确的答案。所以,我想知道我是否错。而且,我仍然对上面显示的两个CDF之间的关系,为什么它们求和为1,以及它们甚至与我真正想知道的事情有什么关系感到困惑。