Questions tagged «gamma-distribution»

由两个严格的正参数索引的非负连续概率分布。

3
泊松是指数级的,就像伽玛泊松是什么一样?
泊松分布可以测量单位时间内的事件,参数为。指数分布使用参数度量直到下一个事件的时间。一个可以将一个分布转换为另一个分布,这取决于对事件或时间进行建模更容易。λλ\lambda1λ1λ\frac{1}{\lambda} 现在,伽马-泊松是具有较大差异的“拉伸”泊松。威布尔分布是具有较大方差的“拉伸”指数。但是,可以像将Poisson转换成指数一样,轻松地将二者转换为彼此吗? 还是有一些其他分布更适合与伽马-泊松分布结合使用? 伽马泊松也称为负二项分布或NBD。


2
两个伽马分布之间的Kullback–Leibler散度
选择通过pdf g (x ; b ,c )= 1参数化伽马分布Γ(b,c)Γ(b,c)\Gamma(b,c)g(x;b,c)=1Γ(c)xc−1bce−x/bg(x;b,c)=1Γ(c)xc−1bce−x/bg(x;b,c) = \frac{1}{\Gamma(c)}\frac{x^{c-1}}{b^c}e^{-x/b} 之间的相对熵Γ(bq,cq)Γ(bq,cq)\Gamma(b_q,c_q)和Γ(bp,cp)Γ(bp,cp)\Gamma(b_p,c_p)是由为[1]中给出 KLGa(bq,cq;bp,cp)=(cq−1)Ψ(cq)−logbq−cq−logΓ(cq)+logΓ(cp)+cplogbp−(cp−1)(Ψ(cq)+logbq)+bqcqbpKLGa(bq,cq;bp,cp)=(cq−1)Ψ(cq)−log⁡bq−cq−log⁡Γ(cq)+log⁡Γ(cp)+cplog⁡bp−(cp−1)(Ψ(cq)+log⁡bq)+bqcqbp\begin{align} KL_{Ga}(b_q,c_q;b_p,c_p) &= (c_q-1)\Psi(c_q) - \log b_q - c_q - \log\Gamma(c_q) + \log\Gamma(c_p)\\ &\qquad+ c_p\log b_p - (c_p-1)(\Psi(c_q) + \log b_q) + \frac{b_qc_q}{b_p} \end{align} 我猜Ψ(x):=Γ′(x)/Γ(x)Ψ(x):=Γ′(x)/Γ(x)\Psi(x):= \Gamma'(x)/\Gamma(x)是digamma函数。 这是没有派生的。我找不到任何可以得出这一点的参考。有什么帮助吗?一个好的参考就足够了。困难的部分是将与gamma pdf 集成。logxlog⁡x\log x [1] WD Penny,法线,伽马,狄利克雷和Wishart密度的KL散度,请访问:www.fil.ion.ucl.ac.uk/~wpenny/publications/densities.ps

1
伽玛和卡方分布之间的关系
如果Y=∑i=1NX2iY=∑i=1NXi2Y=\sum_{i=1}^{N}X_i^2其中Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim \mathcal{N}(0,\sigma^2),即所有XiXiX_i是独立同分布的正态随机变量的零均值与同方差,然后Y∼Γ(N2,2σ2).Y∼Γ(N2,2σ2).Y \sim \Gamma\left(\frac{N}{2},2\sigma^2\right). 我知道卡方分布是伽马分布的特例,但无法得出随机变量的卡方分布YYY。有什么帮助吗?

1
他们为什么会在这里选择伽玛分布?
在本课程的其中一项练习中,我们使用的是Kaggle医学数据集。 练习说: 我们希望对单个费用的分布进行建模,我们也确实希望能够捕获有关该分布的不确定性,以便更好地捕获可能看到的值的范围。加载数据并执行初始视图: 从上面我们可能会怀疑这里存在某种指数状分布。...保险索赔费用可能是多式联运的。伽马分布可能是适用的,我们可以测试一下并非首先是保险索赔的费用的分布。 我查看了 “伽玛分布”,发现“一个连续的,仅正的单峰分布,该分布编码了在Poisson过程中发生“ alpha”事件所需的时间,平均到达时间为“ beta”。 这里没有时间,只有无关的费用,无论是否有保险。 他们为什么要选择伽玛分布?

1
修正的Dirichlet分布的期望值是多少?(整合问题)
使用具有相同比例参数的Gamma变量很容易产生具有Dirichlet分布的随机变量。如果: Xi∼Gamma(αi,β)Xi∼Gamma(αi,β) X_i \sim \text{Gamma}(\alpha_i, \beta) 然后: (X1∑jXj,…,Xn∑jXj)∼Dirichlet(α1,…,αn)(X1∑jXj,…,Xn∑jXj)∼Dirichlet(α1,…,αn) \left(\frac{X_1}{\sum_j X_j},\; \ldots\; , \frac{X_n}{\sum_j X_j}\right) \sim \text{Dirichlet}(\alpha_1,\;\ldots\;,\alpha_n) 问题 如果比例参数不相等会怎样? Xi∼Gamma(αi,βi)Xi∼Gamma(αi,βi) X_i \sim \text{Gamma}(\alpha_i, \beta_i) 那么这个变量的分布是什么? (X1∑jXj,…,Xn∑jXj)∼?(X1∑jXj,…,Xn∑jXj)∼? \left(\frac{X_1}{\sum_j X_j},\; \ldots\; , \frac{X_n}{\sum_j X_j}\right) \sim \; ? 对我来说,知道这种分布的期望值就足够了。 我需要一个可以由计算机非常快速地求值的近似封闭代数公式。 假设精度为0.01就足够了。 您可以假设: αi,βi∈Nαi,βi∈N \alpha_i, \beta_i \in \mathbb{N} 注意简而言之,任务是找到该积分的近似值: f(α⃗ ,β⃗ )=∫Rn+x1∑jxj⋅∏jβαjjΓ(αj)xαj−1je−βjxjdx1…dxnf(α→,β→)=∫R+nx1∑jxj⋅∏jβjαjΓ(αj)xjαj−1e−βjxjdx1…dxn f(\vec{\alpha}, \vec{\beta}) = …

3
考试成绩真的遵循正态分布吗?
我一直在尝试了解要在GLM中使用哪些发行版,而在何时使用正态发行版时我有些糊涂。在我的教科书的一部分中,它说正态分布可能对建模考试成绩很有利。在下一部分中,它询问对汽车保险索赔进行建模的哪种分布是合适的。这次,它说适当的分布将是Gamma或反高斯分布,因为它们仅以正值连续。好吧,我相信考试成绩也只会是正数,而是连续的,那为什么我们要在那使用正态分布呢?正态分布是否允许负值?

2
在具有Gamma分布的GLM中使用R
我目前在理解R语法以使用Gamma分布拟合GLM时遇到问题。 我有一组数据,其中每行包含3个协变量(),响应变量()和形状参数()。我想将Gamma分布的比例建模为3个协变量的线性函数,但是我不了解如何为每行数据将分布的形状设置为 ÿ ķ ķX1,X2,X3X1,X2,X3X_1, X_2, X_3YYYKKKKKK 我认为类似的情况是,对于二项式分布,GLM要求知道每个数据条目的试验次数()。NNN


3
两个独立的伽玛随机变量的总和
根据Wikipedia关于Gamma分布的文章: 如果和ÿ 〜ģ 一米米一个(b ,θ ),其中X和ÿ是独立随机变量,则X + ý 〜ģ 一米米一个(一个+ b ,θ )。X〜ģ 一米米一个(一,θ )X∼Gamma(a,θ)X\sim\mathrm{Gamma}(a,\theta)ÿ〜ģ 一米米一个(b ,θ )Y∼Gamma(b,θ)Y\sim\mathrm{Gamma}(b,\theta)XXXÿYYX+ Y〜ģ 一米米一个(一个+ b ,θ )X+Y∼Gamma(a+b,θ)X+Y\sim \mathrm{Gamma}(a+b, \theta) 但是我没有任何证据。谁能指出我的证据? 编辑:非常感谢Zen,而且我在Wikipedia页面上找到了关于特征函数的答案作为示例。

2
如何测试数据样本是否符合伽玛分布族?
我有一个从连续随机变量X生成的数据样本。从我使用R绘制的直方图中,我想也许X的分布服从一定的Gamma分布。但是我不知道这种伽马分布的确切参数。 我的问题是如何测试X的分布是否属于Gamma分布族?拟合检验有一些好处,例如Kolmogorov-Smirnov检验,Anderson-Darling检验等,但是使用这些检验的限制之一是应事先知道理论分布的参数。谁能告诉我如何解决这个问题?

1
对数链接的Gamma GLM与对数链接的高斯GLM与对数转换的LM
从我的结果来看,GLM Gamma似乎可以满足大多数假设,但这是否是对数转换后的LM值得的改进?我发现的大多数文献都涉及泊松或二项式GLM。我发现使用随机化对广义线性模型假设进行评估非常有用,但是缺少用于做出决策的实际图。希望有经验的人可以为我指明正确的方向。 我想对响应变量T的分布进行建模,其分布如下图所示。如您所见,这是正偏度: 。 我要考虑两个类别因素:METH和CASEPART。 请注意,该研究主要是探索性的,本质上是在对模型进行理论化并围绕模型进行DoE之前作为试点研究。 我在R中具有以下模型及其诊断图: LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat) GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log')) GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log')) 我还通过Shapiro-Wilks残差检验获得了以下P值: LM.LOG: 2.347e-11 GLM.GAMMA: 0.6288 GLM.GAUS: 0.6288 我计算了AIC和BIC值,但是如果我是正确的话,由于GLM / LM中的族不同,它们并不能告诉我太多。 另外,我注意到了极端值,但是由于没有明确的“特殊原因”,因此无法将它们分类为异常值。

1
可以从概念上理解pareto / nbd模型吗?
我正在学习使用BTYD程序包,该程序使用Pareto / NBD模型来预测何时将有客户返回。但是,有关该模型的所有文献都充斥着数学,并且似乎没有对该模型的工作原理进行简单/概念性的解释。是否可以为非数学家理解Pareto / NBD模型?我读完了Fader的那篇著名论文。Pareto / NBD模型进行以下假设: 一世。当处于活动状态时,客户在长度为t的时间段内进行的交易数量将以交易率λ进行泊松分布。 ii。客户之间交易率的异质性遵循具有形状参数r和比例参数α的伽马分布。 iii。每个客户都有一个长度τ的不可观察的“寿命”。客户处于非活动状态的这一点以辍学率µ呈指数分布。 iv)客户之间的辍学率异质性遵循形状参数为s和比例参数为β的伽玛分布。 v。交易率λ和退出率μ随客户而独立变化。” 我不理解假设(ii),(iii)和(iv)的(直觉)原理。为什么只分配这些分布,为什么不分配其他分布? BG / NBD模型的假设还包括: i。)在激活时,客户进行的交易数量遵循Poisson流程,交易率为λ。这等效于假设事务之间的时间以事务速率λ呈指数分布 ii)λ中的异质性遵循伽马分布 iii)进行任何交易后,客户以概率p变得不活跃。因此,根据pmf的(移位)几何分布,客户在各个交易中分布的“退出”点 iv)p中的异质性遵循beta分布 假设(ii),(iii)和(iv)的(直观)合理性也不是很明显。 我将不胜感激。谢谢。

2
如果exp(X)〜Gamma如何快速采样X?
我有一个简单的采样问题,我的内循环看起来像: v = sample_gamma(k, a) 其中sample_gamma从Gamma分布样品以形成样品狄利克雷。 它运行良好,但对于某些k / a值,一些下游计算会出现下溢。 我将其修改为使用日志空间变量: v = log(sample_gamma(k, a)) 在修改了该程序的所有其余部分之后,它可以正常工作(至少在测试案例中它给我的结果是相同的)。但是,它比以前慢。 有没有一种方法可以直接对进行采样而无需使用这样的慢函数?我为此进行了谷歌搜索,但是我什至不知道此发行版是否具有通用名称(log-gamma?)。对数()X,exp(X)〜伽玛X,exp⁡(X)∼GammaX, \exp(X) \sim \text{Gamma}日志()log⁡()\log()

3
您如何计算
如果是指数分布(我= 1 ,。。。,Ñ )具有参数λ和X 我的是相互独立的,什么是期望X一世XiX_i(我= 1 ,。。。,Ñ )(i=1,...,n)(i=1,...,n)λλ\lambdaX一世XiX_i (∑我= 1ñX一世)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 根据和λ以及其他常数?ñnnλλ\lambda 注意:这个问题已经在/math//q/12068/4051上获得了数学答案。读者也可以看看。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.