为什么对上下限的数字有帮助?
上所定义的分布是什么使得它适合作为用于数据的模型上(0 ,1 )。我不认为该文本更意味着什么比“这是对数据的模型(0 ,1 ) ”(或更一般地,在(一个,b ))。(0 ,1 )(0 ,1 )(0 ,1 )(a ,b )
这是什么分布...?
不幸的是,术语“对数奇数分布”不是完全标准的(即使在那时也不是很普通的术语)。
我将讨论一些可能的含义。让我们首先考虑一种为单位间隔中的值构造分布的方法。
到连续随机变量,模型中的常见方法在(0 ,1 )是β分布,并以离散的比例模型的常用方法[ 0 ,1 ]是经缩放的二项式(P = X / Ñ,至少当X是一个计数)。P(0 ,1 )[ 0 ,1 ]P= X/nX
使用β分布另一种方法是采取一些连续逆CDF(),并使用它来变换的值(0 ,1 )的实线(或很少,真正的半行),然后使用任何相关的分布(G),以对转换范围内的值进行建模。这提供了许多可能性,因为实线(F ,G)上的任意一对连续分布都可用于变换和模型。F− 1(0,1)GF,G
因此,例如,对数奇数变换 (也称为logit)就是这样的逆CDF变换(是标准logistic的逆CDF),然后有很多分布我们可以考虑作为Y的模型。ÿ= 日志(P1 − P)ÿ
然后,我们可以对Y使用logistic 模型,Y是实际线上的简单两参数族。转化回(0 ,1 )通过逆数优势变换(即,P = EXP (Ý )(μ ,τ)ÿ(0 ,1 ))为P产生两个参数分布,一个参数分布可以是单峰,U形或J形,对称或偏斜,在许多方面都类似于beta分布(个人而言,我将其称为logit -logistic,因为它的logit是logistic)。以下是一些不同的μ,τ值的示例:P= 经验(是)1 + 经验(是)Pμ ,τ
看看Witten等人在文本中的简短提及,这可能就是“对数奇数分布”的意图-但它们很可能意味着其他含义。
另一种可能性是预期的是logit-normal。
但是,例如,van Erp和van Gelder(2008)[ 1 ]似乎已经使用过该术语,指的是基于beta分布的对数奇数变换(因此实际上以F为对数,G为对数)。日志的一个分布的β-素随机变量,或等价2卡方随机变量的日志)的差的分布。但是,他们正在使用它来计算离散的模型计数比例。这当然导致一些问题(由试图与有限概率在0和1分配用一个模型(0 ,1 )[ 1 ]FG(0,1)),然后他们似乎花了很多精力。(避免不适当的模型似乎更容易,但是也许就是我。)
其他几份文件(我发现至少有三份)将对数奇数的样本分布(即上述的比例)称为“对数奇数分布”(在某些情况下,P为离散比例*,而在某些情况下,在一个连续的比例的情况下)-因此在这种情况下,它不是概率模型,但您可以在实际生产线上应用一些分布模型。YP
PY−∞∞
[2]
如您所见,这不是一个具有单一含义的术语。如果没有Witten或该书的其他作者之一明确的指示,我们只能猜测目的是什么。
[1]:Noel van Erp和Pieter van Gelder,(2008年),
“如何解释发生故障时的Beta分布”
,第六届国际概率研讨会论文集,达姆施塔特
pdf链接
[2]:郭燕(2009),
《 NDE系统荚能力评估和鲁棒性的新方法》,
论文提交给密歇根州底特律市韦恩州立大学研究生院