f(x)∝xα(1−x)β
或似乎更常用的一种
f(x)∝xα−1(1−x)β−1
但是,为什么第二个公式中确切有“ ”呢?−1
第一个公式在直观上似乎更直接对应于二项式分布
g (k )∝ p k(1 - p )n - k
但是从的角度来看“可见”p
那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果?
如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。
f(x)∝xα(1−x)β
或似乎更常用的一种
f(x)∝xα−1(1−x)β−1
但是,为什么第二个公式中确切有“ ”呢?−1
第一个公式在直观上似乎更直接对应于二项式分布
g (k )∝ p k(1 - p )n - k
但是从的角度来看“可见”p
那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果?
如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。
Answers:
这是一个关于自由度和统计参数的故事,为什么这两个具有直接的简单联系是很好的。
从历史上看,“ − 1 ”术语出现在Euler对Beta函数的研究中。到1763年,他一直在使用该参数化,阿德里安·玛丽·勒让德(Adrien-Marie Legendre)也是如此:他们的使用建立了后来的数学惯例。这项工作早于所有已知的统计应用程序。
现代数学理论提供了充足的迹象表明,通过在分析,数论,几何和应用的财富,即“ - 1 ”条款实际上有一定的意义。我在对该问题的评论中已勾勒出其中一些原因。
更令人感兴趣的是“正确的”统计参数化应该是什么。这不是很清楚,也不必与数学惯例相同。有大量的常用的,相互关联的概率分布族。因此,用于命名(即参数化)一个家族的约定通常暗含相关约定来命名相关家族。更改一个参数设置,您将需要全部更改。因此,我们可能会在这些关系中寻找线索。
很少有人会不同意最重要的分销家庭是来自正常家庭。回想一下,一个随机变量X被说成是“正态分布”时(X - μ )/ σ具有概率密度˚F (X )成比例的实验值(- X 2 / 2 )。当σ = 1且μ = 0时,称X为标准正态分布。
使用相对简单的统计量研究了许多数据集x 1,x 2,… ,x n,这些统计量涉及数据的合理组合和低功效(通常是平方)。如果将这些数据建模为来自正态分布的随机样本-以便将每个x i视为正态变量X i的实现,则所有X i共享一个公共分布,并且是独立的-这些统计信息的分布由该正态分布确定。在实践中最常出现的是
吨ν,学生吨分布与 ν = ñ - 1 “自由度” 这是统计量的分布吨= ˉ X
χ 2 ν,该 χ 2(卡方)分布与 ν “自由度”(DF)。这是 ν个独立标准正态变量的平方和的分布。因此平均这些变量的平方的分布将是一个 χ 2分布缩放的由 1 / ν:我将把这个称为“归一化” χ 2分布。
˚F ν 1,ν 2,所述 ˚F与参数率分布(ν 1,ν 2)是两个独立的归一化的比率 χ 2个分布与 ν 1和 ν 2点的自由度。
数学计算表明,所有这三种分布都具有密度。重要的是,密度χ 2 ν分布正比于伽玛(欧拉积分定义的被积Γ)函数。让我们比较一下:
˚F χ 2 ν(2 X )α X ν / 2 - 1 ë - X ;˚F Γ (ν )(X )α X ν - 1 ë - X。
这表明,两次χ 2 ν变量具有参数伽玛分布ν / 2。一半的因子很麻烦,但是减去1会使关系变得更糟。这已经提供了一个引人注目的问题的答案:如果我们希望实现的参数χ 2分布来计算产生它(最多的一个因素平方普通变量的数目1 / 2),然后在它的密度函数必须在指数比这个数字少一半。
为什么的因素1 / 2少麻烦比相差1?原因是当我们加总时,该因素将保持一致。如果n个独立标准法线的平方和与参数n(乘以某个因数)的Gamma分布成正比,则m个独立标准法线的平方和与参数m(与同一个因子一起)与Gamma分布成正比。,则所有n + m变量的平方和与具有参数m + n的Gamma分布成比例(仍然乘以相同因子)。
但是,如果我们要从数学公式中删除看上去令人讨厌的“ − 1 ”,这些良好的关系将变得更加复杂。例如,如果我们改变Gamma分布的参数,指的是实际功率X式中,使得χ 2 1分布将涉及到一个“伽玛(0 )(”分配自的功率X在其PDF是1 - 1 = 0),则三个总和χ 2 1分布将不得不被称为“伽马(2 )
同样,F比分布的概率函数与Beta分布密切相关。事实上,当ÿ具有˚F比分布,分布Ž = ν 1 Ÿ /(ν 1 Ÿ + ν 2)具有贝塔(ν 1 / 2 ,ν 2 / 2 )的分布。它的密度函数与
˚F Ž(ż )α Ž ν 1 / 2 - 1(1 - Z ^ )ν 2 / 2 - 1。
此外-服用这些想法全圆-一个学生的平方吨与分布ν DF具有˚F与参数比分布(1 ,ν )。再一次,很明显,保持常规参数设置与有助于自由度的基础计数保持清晰的关系。
从统计学的角度来看的话,这将是最自然,最易于使用的传统的数学参数化的变化Γ和贝塔分布:我们应该更喜欢调用Γ (α )分布的“ Γ (2 α )分布”和贝塔(α ,β )分布应该被称为“测试(2 α ,2 β )分布。” 实际上,我们已经这样做了:这正是我们继续使用名称“ Chi-squared”和“ F
该符号会误导您。公式(1 )中有一个“隐藏− 1 ” ,因为在(1 )中,α > 0。α和β的这些范围对于确保密度的积分不会发散是必不可少的。为此,在(1 )中考虑情况α
对我而言,指数中-1的存在与Gamma函数的发展有关。Gamma函数的动机是找到一条平滑曲线以连接阶乘x的点!。由于不可能计算x !直接如果X不是整数,这个想法是要找到一个功能的任何X ≥ 0,其满足由阶乘定义,即递推关系
f (1 )= 1˚F (X + 1 )= X ⋅ ˚F (X )。
解决方案是通过积分的收敛。对于定义为
˚F (X + 1 )= ∫ ∞ 0吨Xë-Xd吨,
各部分的集成提供以下内容:
f (x + 1 )= ∫ ∞ 0吨Xë-Xd吨= [ - 吨X ë - X ] ∞ 0 + ∫ ∞ 0 X ⋅ 吨X - 1 ë - X d 吨= LIM X →交通∞( - 吨X ë - X) - 0 ⋅ ë - 0 + X ⋅ ∫ ∞ 0吨X - 1 ë - X d 吨= 0 - 0 + X ·&∫ ∞ 0吨X - 1 ë - X d 吨= X ⋅ ˚F (X )。
因此,上面的函数满足此属性,并且指数中的-1源自零件积分的过程。请参阅Wikipedia文章https://en.wikipedia.org/wiki/Gamma_function。
编辑:如果我的帖子不完全清楚,我深表歉意;我只是想指出,就我的观点而言,β分布中-1的存在来自通过Gamma函数对阶乘的泛化。有两个条件:˚F (1 )= 1和˚F (X + 1 )= X ⋅ ˚F (X )。我们有Γ (x )= (x − 1 )!,因此满足Γ (x + 1 )=X ⋅ Γ (X )= X ⋅ (X - 1 )!= x !。另外,我们有 Γ (1 )= (1 − 1 )!= 0 != 1。对于参数为 α ,β的beta分布,二项式系数的推广为 Γ (α + β )Γ (α )·&Γ (β ) = (α + β - 1 )!(α - 1 )!⋅ ( β - 1 )!。对于两个参数,分母中都为-1。