Questions tagged «gamma-distribution»

由两个严格的正参数索引的非负连续概率分布。

1
Y的密度=伽玛分布的X的log(X)
这个问题与此帖子密切相关 假设我有一个随机变量,并且我定义ÿ = 日志(X )。我想找到Y的概率密度函数。X〜伽玛(k ,θ )X∼Gamma(k,θ)X \sim \text{Gamma}(k, \theta)ÿ= 日志(X)Y=log⁡(X)Y = \log(X)ÿYY 我原本以为我将只定义累积分布函数X,更改变量,然后将积分的“内部”作为我的密度,就像这样, P(X≤ Ç )P(是≤ 日志c )= ∫C01个θķ1个Γ (k )Xk − 1Ë− xθdX= ∫日志(c )日志(0 )1个θķ1个Γ (k )经验值(y)k − 1Ë− 经验(y)θ经验值(y)dÿP(X≤c)=∫0c1θk1Γ(k)xk−1e−xθdxP(Y≤log⁡c)=∫log⁡(0)log⁡(c)1θk1Γ(k)exp⁡(y)k−1e−exp⁡(y)θexp⁡(y)dy\begin{align} P(X \le c) & = \int_{0}^{c} \frac{1}{\theta^k} \frac{1}{\Gamma(k)} x^{k- 1} e^{-\frac{x}{\theta}} dx \\ P(Y \le \log c) …

2
平方伽玛的期望
如果使用和参数化了Gamma分布,则:αα\alphaββ\beta E(Γ(α,β))=αβE(Γ(α,β))=αβ E(\Gamma(\alpha, \beta)) = \frac{\alpha}{\beta} 我想计算平方Gamma的期望值,即: E(Γ(α,β)2)=?E(Γ(α,β)2)=? E(\Gamma(\alpha, \beta)^2) = ? 我认为是: E(Γ(α,β)2)=(αβ)2+αβ2E(Γ(α,β)2)=(αβ)2+αβ2 E(\Gamma(\alpha, \beta)^2) = \left(\frac{\alpha}{\beta}\right)^2 + \frac{\alpha}{\beta^2} 有人知道后一种表达是否正确吗?

1
分层Gamma-Poisson模型的超先验密度
在数据的层次模型中,其中 在实践中选择值似乎很典型(,以使伽玛分布的均值和方差与数据的均值和方差大致匹配(例如Clayton和Kaldor,1987年“疾病测绘的年龄标准化相对风险的经验贝叶斯估计”,Biometrics)。显然,这只是一个临时解决方案,因为它会夸大研究人员对参数的信心yyyy∼Poisson(λ)y∼Poisson(λ)y \sim \textrm{Poisson}(\lambda) λ∼Gamma(α,β)λ∼Gamma(α,β)\lambda \sim \textrm{Gamma}(\alpha, \beta)α,β)α,β)\alpha, \beta)yyy(α,β)(α,β)(\alpha, \beta)即使基础数据生成过程保持不变,已实现数据的微小波动也可能对伽玛密度产生重大影响。 此外,Gelman 在贝叶斯数据分析(第二版)中写道,这种方法是“ 草率的 ”。在书和本文中(从第3232页开始),他建议以类似于大鼠肿瘤示例(从第130页开始)的方式选择一些优先级较高的密度)。p(α,β)p(α,β)p(\alpha, \beta) 尽管很明显,只要只要产生一定的后验密度就可以接受,但我还没有找到研究人员过去用于此问题的任何超高密度示例。如果有人可以指出我使用超优先密度来估计泊松-伽马模型的书籍或文章,我将不胜感激。理想情况下,我对感兴趣,它相对平坦,并且会像老鼠肿瘤示例中的数据一样占主导地位,或者对几种替代规格以及与每种规格相关的取舍进行讨论。p(α,β)p(α,β)p(\alpha, \beta)p(α,β)p(α,β)p(\alpha, \beta)

2
正确使用和解释零膨胀伽玛模型
背景:我是一名生物统计学家,目前正在努力研究细胞表达率数据集。该研究使从各种供体中成组收集的大量细胞暴露于某些肽。细胞要么表达某些生物标志物,要么不表达。然后记录每个捐助者群体的答复率。应答率(以百分比表示)是关注的结果,而肽暴露则是预测因素。 请注意,观察结果集中在捐助者之内。 由于我只有汇总数据,因此我将捐助方的回应率视为连续数据(至少目前如此)。 复杂性源于我的数据中有很多零的事实。太多不容忽视。我正在考虑使用零膨胀伽玛模型来处理这样一个事实,即我歪曲了连续数据以及过多的零。我也考虑过Tobit模型,但是由于它假设检查范围是下限,而不是真正的零(计量经济学家可能会说这是没有意义的),因此它看起来很差。 问题:通常来说,什么时候使用零膨胀伽玛模型合适?也就是说,有什么假设?以及如何解释其推论?如果您有任何讨论此文章的链接,我将不胜感激。 我在SAS-L上找到了一个链接,其中Dale McLerran为零膨胀的伽马模型提供了NLMIXED代码,因此这似乎是可能的。尽管如此,我还是不想盲目地充电。

2
分配百分比数据
我有一个关于使用我的数据创建模型的正确分布的问题。我用50个地块进行了森林清查,每个地块的尺寸为20m×50m。对于每个图,我估计了遮蔽地面的树冠的百分比。每个地块都有一个以百分比表示的顶盖覆盖率值。百分比范围从0到0.95。我正在建立一个树冠覆盖率百分比模型(Y变量),并具有一个基于卫星图像和环境数据的独立X变量的矩阵。 我不确定是否应该使用二项式分布,因为二项式随机变量是n个独立试验的总和(即,伯努利随机变量)。百分比值不是试验的总和;它们是实际百分比。即使没有上限,我也应该使用伽玛吗?我应该将百分比转换为整数并使用泊松作为计数吗?我应该坚持使用高斯吗?我没有在文献或教科书中找到许多尝试以这种方式模拟百分比的示例。任何提示或见解表示赞赏。 谢谢您的回答。实际上,正是我需要的beta发行版,并在本文中进行了详细讨论: Eskelson,BN,Madsen,L.,Hagar,JC和Temesgen,H.(2011)。使用Beta回归和copula模型估算河岸底层植被覆盖度。森林科学,57(3),212-221。 这些作者使用Cribari-Neto和Zeileis的R中的betareg软件包。 下面的文章讨论了转换包含百分比范围内的真0和/或1的beta分布响应变量的好方法: Smithson,M.和J. Verkuilen,2006年。更好的柠檬榨汁器?具有β分布因变量的最大似然回归,《心理方法》,11(1):54–71。

1
指数和伽马之间的分布的名称?
密度F(š )α 小号s + αË− 秒,s > 0f(s)∝ss+αe−s,s>0f(s)\propto \frac{s}{s+\alpha}e^{-s},\quad s > 0,其中α ≥ 0α≥0\alpha \ge 0是一个参数,生命指数(之间α = 0α=0\alpha=0)和Γ (2 ,1 )Γ(2,1)\Gamma(2,1)(α → ∞α→∞\alpha \to \infty)分布。只是好奇这是否恰好是更广泛的发行系列的一个例子?我不这样认为。

2
Gamma随机变量的差异
给定两个独立的随机变量和,差的分布是多少,即?ý 〜ģ 一米米一个(α Ý,β ÿ)d = X - ÿX∼Gamma(αX,βX)X〜G一个米米一个(αX,βX)X\sim \mathrm{Gamma}(\alpha_X,\beta_X)Y∼Gamma(αY,βY)ÿ〜G一个米米一个(αÿ,βÿ)Y\sim \mathrm{Gamma}(\alpha_Y,\beta_Y)D=X−Yd=X-ÿD=X-Y 如果结果不为人所知,我将如何得出结果?

1
如何在一幅图中绘制拟合的伽玛分布图和实际图?
加载所需的包。 library(ggplot2) library(MASS) 生成10,000个适合伽玛分布的数字。 x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] 假设我们不知道x符合哪个分布,则绘制概率密度函数。 t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = y)) + theme_classic() 从图中可以看出,x的分布与伽马分布非常相似,因此fitdistr()在包中使用它MASS可以获取形状和伽马分布速率的参数。 fitdistr(x,"gamma") ## output ## shape rate ## 2.0108224880 0.2011198260 ## (0.0083543575) …

3
统计量与伽玛分布的独立性
设是来自伽马分布G a m m a (α ,β )的随机样本。X1个,。。。,XñX1,...,XnX_1,...,X_nģ 一米米一个(α ,β)Gamma(α,β)\mathrm{Gamma}\left(\alpha,\beta\right) 让和小号2是样品均值和样本方差,分别。X¯X¯\bar{X}小号2S2S^2 然后证明或反驳该和小号2 / ˉ X 2是独立的。X¯X¯\bar{X}小号2/ X¯2S2/X¯2S^2/\bar{X}^2 我的尝试:由于,我们需要检查的独立性ˉX和(X我小号2/ X¯2= 1n − 1∑ñ我= 1(X一世X¯− 1 )2S2/X¯2=1n−1∑i=1n(XiX¯−1)2S^2/\bar{X}^2 = \frac{1}{n-1} \sum_{i=1}^n \left(\frac{X_i}{\bar{X}}-1\right)^2 X¯X¯\bar{X},但我应该怎么建立它们之间的独立性?(X一世X¯)ñ我= 1(XiX¯)i=1n\left(\frac{X_i}{\bar{X}} \right)_{i=1}^{n}



2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.