看来二项式分布在形式上与beta分布非常相似,并且我可以在任一pdf上重新参数化常数,以使它们看起来相同。那么,为什么我们需要beta发行版?是出于特定目的吗?谢谢!
看来二项式分布在形式上与beta分布非常相似,并且我可以在任一pdf上重新参数化常数,以使它们看起来相同。那么,为什么我们需要beta发行版?是出于特定目的吗?谢谢!
Answers:
它们是相关的,但实际上并没有那么相似。
在beta中,变量(及其补数)被提高到一定的幂,但是在二项式中,变量就是幂(并且它也以二项式系数出现)。
尽管功能形式确实有些相似(一个中的某个术语与另一个中的多个术语相对应),但表示参数的变量和每个变量中的随机变量却不同。那很重要;这就是为什么它们实际上根本不是一回事的原因。
二项式分布通常用于计数或按比例缩放的形式用于基于计数的比例(尽管您可以纯粹出于实际的目的将其用于其他有界离散随机变量)。它是离散的。
Beta分布是连续的,因此通常不用于计数。
通过示例的方式,比较这两个功能:
和。
这两个函数都是由相同形式的表达式(某种形式为)定义的,但是变量和常数的作用是互换的,并且域是不同的。beta和二项式之间的关系就像这两个函数之间的关系一样。
-总而言之:不同的形式和不同的域
这是一个简单的beta发行版示例,。相同的工作是哪个二项式分布?
或者考虑一个 ; 很难找到看起来相似的二项式。这是一种尝试:
整个beta pdf位于二项式pf中的前两个绿色尖峰之间,尽管由于y轴测量的是不同的东西,所以它们实际上无法显示在同一图上。
尽管形状在某种程度上都是相似的,但都是偏斜的,但是它们确实有很大不同,并且用于不同的事物。
-
这是一个挑战:
对于和,找到可以同时准确地(例如,在以内)的二项式分布(大概缩放) 乘以均值和方差或均值和范围(您选择)相同的正确概率,也大致重现了这三个子区间的概率:(a),(b)和(c)
Beta用于执行许多操作,包括模型连续比例,二项式的参数起先验作用,它是统一订单统计信息的分布(并且可以用于推导其他订单统计信息的分布)连续分布,用作二项式的混合分布(生成beta-二项式分布),以建模项目管理中的任务完成时间,以及许多其他事情。