Questions tagged «gamma-distribution»

由两个严格的正参数索引的非负连续概率分布。

4
何时使用伽马GLM?
伽马分布可以采用多种形式,并且通过其两个参数给出了均值和方差之间的联系,它似乎适合处理非负数据中的异方差,这使得对数转换的OLS可以没有WLS或某种异方差一致的VCV估计器就无法做到。 在常规的非负数据建模中,我会更多地使用它,但是我不认识其他使用它的人,我还没有在正式的课堂环境中学习它,而我阅读的文献也从未使用过它。每当我使用诸如“伽马GLM的实际使用”之类的Google字词时,我都会提出建议将其用于Poisson事件之间的等待时间。好。但这似乎是限制性的,并且不能唯一使用。 天真的,考虑到伽玛的灵活性,伽玛GLM似乎是对非负数据建模的一种相对假设的轻松手段。当然,您需要像任何模型一样检查QQ图和残差图。但是我有什么严重的缺点想念吗?除了与“仅运行OLS”的人进行交流之外?

4
在LM和GLM之间选择对数转换后的响应变量
我试图了解使用广义线性模型(GLM)与线性模型(LM)的原理。我在下面创建了一个示例数据集: 日志(y)= x + εlog⁡(y)=x+ε\log(y) = x + \varepsilon 该示例的误差不随y的大小而变化,因此我假设对数转换的y的线性模型是最好的。在下面的示例中,确实是这种情况(我认为)-因为LM在对数转换后的数据上的AIC最低。具有对数链接功能的Gamma分布GLM的AIC具有较低的平方和(SS),但是附加的自由度会导致AIC稍高。我惊讶于高斯分布AIC如此之高(即使SS是模型中最低的)。εε\varepsilonÿyy 我希望就何时应该使用GLM模型获得一些建议-即我应该在LM模型拟合残差中寻找一些东西来告诉我另一种分布更合适吗?另外,应该如何选择合适的分销家庭。 在此先感谢您的帮助。 [编辑]:我现在调整了摘要统计信息,以便对数转换后的线性模型的SS与具有对数链接功能的GLM模型相当。现在显示统计图。 例 set.seed(1111) n <- 1000 y <- rnorm(n, mean=0, sd=1) y <- exp(y) hist(y, n=20) hist(log(y), n=20) x <- log(y) - rnorm(n, mean=0, sd=1) hist(x, n=20) df <- data.frame(y=y, x=x) df2 <- data.frame(x=seq(from=min(df$x), to=max(df$x),,100)) #models mod.name <- …


4
R?中非负变量密度图的好方法
plot(density(rexp(100)) 显然,左侧所有的密度都表示偏差。 我希望总结一些非统计人员的数据,并且我想避免有关为何非负数据的密度在零左边的问题。这些图用于随机检查;我想按治疗组和对照组显示变量的分布。分布通常是指数级的。由于各种原因,直方图比较棘手。 快速的Google搜索使统计人员可以在非负内核上进行工作,例如: this。 但是,它有没有在R中实现?在已实现的方法中,对于描述性统计,它们中的任何一种是否“最佳”? 编辑:即使from命令可以解决我当前的问题,也很高兴知道是否有人基于非负密度估计的文献实现了内核

4
Gamma随机变量的一般和
我已经读到具有相同比例参数的Gamma随机变量的总和是另一个Gamma随机变量。我还看过Moschopoulos撰写的论文,该论文描述了一种对一般Gamma随机变量集求和的方法。我曾尝试实施Moschopoulos的方法,但尚未成功。 一般的Gamma随机变量集的总和是什么样的?为了使这个问题具体,它看起来像什么: Gamma(3,1)+Gamma(4,2)+Gamma(5,1)Gamma(3,1)+Gamma(4,2)+Gamma(5,1)\text{Gamma}(3,1) + \text{Gamma}(4,2) + \text{Gamma}(5,1) 如果上述参数不是特别有用,请建议其他参数。

2
伽玛与对数正态分布
我有一个实验观察到的分布,看起来与gamma或对数正态分布非常相似。我已经读到对数正态分布是随机变量的最大熵概率分布,其ln (X )的均值和方差是固定的。伽马分布是否具有任何类似的性质?XXXln(X)ln⁡(X)\ln(X)

5
常见分布的真实示例
我是一名研究生,对统计感兴趣。我总体上喜欢这种材料,但是有时我很难考虑将其应用于现实生活中。具体来说,我的问题是关于常用的统计分布(正态-β-伽玛等)。我猜在某些情况下,我得到了使分布变得非常漂亮的特定属性-例如指数的无记忆属性。但是对于其他许多情况,我对教科书中常见发行版的重要性和应用领域都没有直觉。 可能有很多很好的消息源可以解决我的问题,如果您能分享这些问题,我将非常高兴。如果我可以将其与现实生活中的示例联系起来,那么我会更加热衷于该材料。

3
伽玛分布与正态分布之间的关系
我最近发现有必要为平均值为0的正常随机变量的平方导出pdf。无论出于什么原因,我都选择不预先对方差进行归一化。如果我正确执行此操作,则此pdf如下: N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} 我注意到这实际上只是伽马分布的参数化: N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2) 然后,从两个伽玛(具有相同比例参数)的总和等于另一个伽玛的事实出发,可以得出该伽玛等于平方正态随机变量的总和。kkk N2Σ(x;k,σ2)=Gamma(x;k2,2σ2)NΣ2(x;k,σ2)=Gamma⁡(x;k2,2σ2) N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2) 这让我有些惊讶。即使我知道分布(即标准正态RV 平方和的分布)是伽玛的一种特例,但我没有意识到伽玛本质上只是一个允许归纳和任何方差的随机变量。这也导致了我以前从未遇到过的其他特征,例如指数分布等于两个平方正态分布之和。χ2χ2\chi^2 这对我来说有点神秘。以我上面概述的方式,正态分布对伽马分布的推导至关重要吗?我检查的大多数资源都没有提到这两个分布在本质上是相关的,甚至就此而言,它还描述了伽玛的推导方式。这使我认为有些简单的事实正在发挥作用,我只是以复杂的方式强调了这些事实?

2
如何使用family = Gamma解释GLM中的参数
该问题是从Stack Overflow 迁移而来的,因为可以通过交叉验证来回答。 迁移 5年前。 我对带有伽玛分布因变量的GLM的参数解释有疑问。这是R通过日志链接返回给我的GLM的结果: Call: glm(formula = income ~ height + age + educat + married + sex + language + highschool, family = Gamma(link = log), data = fakesoep) Deviance Residuals: Min 1Q Median 3Q Max -1.47399 -0.31490 -0.05961 0.18374 1.94176 Coefficients: Estimate Std. Error t value …

2
哪些诊断程序可以验证特定GLM系列的使用?
这似乎很基础,但是我总是在这一点上陷入困​​境…… 我处理的大多数数据都是非常规的,并且大多数分析都是基于GLM结构的。对于当前的分析,我有一个响应变量,即“步行速度”(米/分钟)。我很容易确定自己无法使用OLS,但是在确定哪个家庭(伽玛,威布尔等)合适的时候,我存在很大的不确定性! 我使用Stata并查看诸如残差和异方差,残差与拟合值之类的诊断信息。 我知道计数数据可以采用比率(例如发生率)的形式,并且使用了伽玛(类似于过度分散的离散负二项式模型),但是只是想用“吸烟枪”说是的,您就对了家庭。看看标准化残差与拟合值是唯一,最好的方法吗?我也想使用混合模型来说明数据中的某些层次结构,但首先需要弄清哪种家庭最能描述我的响应变量。 任何帮助表示赞赏。Stata语言特别感谢!

3
如何从
我想根据密度f (a )∝ c a d a − 1进行采样 F(一)α Ç一种da − 1Γ (a )1个(1 ,∞ )(一)F(一种)∝C一种d一种-1个Γ(一种)1个(1个,∞)(一种) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) 其中CCc和ddd严格为正。(动机:当Gamma密度的形状参数具有一致的先验值时,这对于Gibbs采样很有用。) 有谁知道如何轻松地从这种密度采样?也许这是标准的,只是我不知道的事情? 我能想到一个笨排斥sampliing算法,将更多或更少的工作(找到模式的一种∗一种∗a^*的FFf,样品(a,u)(一种,ü)(a,u)从均匀在一个大的盒[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]和拒绝如果u>f(a)u>f(a)u>f(a)),但(i)其是不是在所有有效的和(ii)f(a∗)f(a∗)f(a^*)对于中等大小的和d来说,对于计算机来说它太大了,难以处理。(请注意,大c和d的模式大约为a = c d。)cccdddcccddda=cda=cda=cd 在此先感谢您的帮助!

2
使用样本均值和标准差估计伽玛分布参数
我正在尝试估计最适合我的数据样本的伽玛分布的参数。我只想使用mean,std(因此使用方差数据样本中),而不是实际值-因为这些值在我的应用程序中并不总是可用。 根据该文档,以下公式可用于估计形状和比例: 我为数据尝试了此操作,但是与使用python编程库在实际数据上拟合伽玛分布相比,结果却大不相同。 我附上我的数据/代码以显示手头的问题: import matplotlib.pyplot as plt import numpy as np from scipy.stats import gamma data = [91.81, 10.02, 27.61, 50.48, 3.34, 26.35, 21.0, 79.27, 31.04, 8.85, 109.2, 15.52, 11.03, 41.09, 10.75, 96.43, 109.52, 33.28, 7.66, 65.44, 52.43, 19.25, 10.97, 586.52, 56.91, 157.18, 434.74, 16.07, 334.43, 6.63, 108.41, 4.45, …

3
指数随机变量的总和遵循Gamma,并与参数混淆
我了解了遵循Gamma分布的指数随机变量的总和。 但是我读到的所有参数化都是不同的。例如,Wiki描述了这种关系,但是不说它们的参数实际上是什么意思?形状,比例,比率,1 /比率? 指数分布: xxx〜exp(λ)exp(λ)exp(\lambda) f(x|λ)=λe−λxf(x|λ)=λe−λxf(x|\lambda )=\lambda {{e}^{-\lambda x}} E[x]=1/λE[x]=1/λE[x]=1/ \lambda var(x)=1/λ2var(x)=1/λ2var(x)=1/{{\lambda}^2} 伽玛分布:Γ(shape=α,scale=β)Γ(shape=α,scale=β)\Gamma(\text{shape}=\alpha, \text{scale}=\beta) ë[X]=αβv一个[R[X]=αβ2f(x|α,β)=1βα1Γ(α)xα−1e−xβf(x|α,β)=1βα1Γ(α)xα−1e−xβf(x|\alpha ,\beta )=\frac{1}{{{\beta }^{\alpha }}}\frac{1}{\Gamma (\alpha )}{{x}^{\alpha -1}}{{e}^{-\frac{x}{\beta }}} E[x]=αβE[x]=αβE[x]=\alpha\beta var[x]=αβ2var[x]=αβ2var[x]=\alpha{\beta}^{2} 在此设置中,什么?正确的参数化是什么?如何将此扩展到卡方?∑i=1nxi∑i=1nxi\sum\limits_{i=1}^{n}{{{x}_{i}}}

1
用Gamma分布构造Dirichlet分布
令是相互独立的随机变量,每个变量的伽玛分布参数为表示,与X1,…,Xk+1X1,…,Xk+1X_1,\dots,X_{k+1}αi,i=1,2,…,k+1αi,i=1,2,…,k+1\alpha_i,i=1,2,\dots,k+1Yi=XiX1+⋯+Xk+1,i=1,…,kYi=XiX1+⋯+Xk+1,i=1,…,kY_i=\frac{X_i}{X_1+\cdots+X_{k+1}},i=1,\dots,kDirichlet(α1,α2,…,αk;αk+1)Dirichlet(α1,α2,…,αk;αk+1)\text{Dirichlet}(\alpha_1,\alpha_2,\dots,\alpha_k;\alpha_{k+1}) 的联合PDF。然后找到关节(y_1,\ dots,Y_ {k + 1})的 pdf文件,我找不到jacobian即J(\ frac {x_1,\ dots,x_ {k + 1}} {y_1,\ dots,y_ {k + 1} })(Ý1,...,ÿķ+1)Ĵ(X1,...,X ķ + 1(X1,…,Xk+1)=e−∑k+1i=1xixα1−11…xαk+1−1k+1Γ(α1)Γ(α2)…Γ(αk+1)(X1,…,Xk+1)=e−∑i=1k+1xix1α1−1…xk+1αk+1−1Γ(α1)Γ(α2)…Γ(αk+1)(X_1,\dots,X_{k+1})=\frac{e^{-\sum_{i=1}^{k+1}x_i}x_1^{\alpha_1-1}\dots x_{k+1}^{\alpha_{k+1}-1}}{\Gamma(\alpha_1)\Gamma(\alpha_2)\dots \Gamma(\alpha_{k+1})}(Y1,…,Yk+1)(Y1,…,Yk+1)(Y_1,\dots,Y_{k+1})J(x1,…,xk+1y1,…,yk+1)J(x1,…,xk+1y1,…,yk+1)J(\frac{x_1,\dots,x_{k+1}}{y_1,\dots,y_{k+1}})

2
伽玛随机变量对数的偏度
考虑伽玛随机变量 。对于均值,方差和偏度,有一些简洁的公式:X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar⁡[X]=αθ2=1/α⋅E[X]2Skewness⁡[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} 现在考虑对数转换后的随机变量。维基百科给出了均值和方差的公式:Y=log(X)Y=log⁡(X)Y=\log(X) E[Y]Var[Y]=ψ(α)+log(θ)=ψ1(α)E[Y]=ψ(α)+log⁡(θ)Var⁡[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} 通过digamma和trigamma函数定义为γ函数对数的一阶和二阶导数。 偏度的公式是什么? 会出现四伽马功能吗? (让我对此感到疑惑的是在对数正态分布和伽马分布之间进行选择,请参阅Gamma与对数正态分布。在其他方面,它们的偏度属性有所不同。特别是,对数正态的对数偏度几乎等于零。伽玛对数的偏度为负。但是如何为负?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.