如何参数化两个正态分布变量的比率或一个的倒数?


12

问题: 我正在参数化分布,以用作贝叶斯元分析中的先验和数据。数据在文献中以摘要统计的形式提供,几乎专门假定为正态分布(尽管所有变量均不能小于0,某些变量是比率,某些变量是质量,等等)。

我遇到了两种情况,但我没有解决方案。有时感兴趣的参数是数据的倒数或两个变量的比率。

例子:

  1. 两个正态分布变量的比率:
    • 数据:氮和碳百分比的平均值和标准偏差
    • 参数:碳氮比。
  2. 正态分布变量的倒数:
    • 数据:质量/面积
    • 参数:面积/质量

我当前的方法是使用仿真:

例如,对于一组碳和氮百分比数据,均值:xbar.n,c,方差:se.n,c,样本大小:nn,nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

我想参数化ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

然后为我的先前选择范围为的最佳拟合分布0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

问题: 这是有效的方法吗?还有其他/更好的方法吗?

提前致谢!

μ=0

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya,J.和Armstrong,D.和Gressis,N.,1975年。关于两个正态分布变量之比的注释。管理科学21:1338--1341


我应该将有关计算柯西随机抽签方差的更新问题作为一个单独的问题发布吗?
戴维·勒鲍尔

μ=0

μ

XYZ=XYxyp(x,y)dxdy

Answers:


6

您可能需要查看Wikipedia上有关Ratio Distribution的文章中的一些参考。您可能会发现可以使用更好的近似值或分布。否则,您的方法听起来不错。

更新我认为更好的参考可能是:

请参阅第195页的公式2-4。

更新2

关于您有关柯西的方差的最新问题-正如约翰·库克在评论中指出的那样,方差不存在。因此,采用样本方差根本无法充当“估计量”。实际上,您会发现样本方差根本不会收敛,而是随着您继续取样而剧烈波动。


感谢您的参考,在这里我找到了Haaya 1975参考和问题中的方程式,尽管我很高兴再次保证方程式适合我的问题。
大卫·勒鲍尔

快速浏览Haaya,似乎他们关心的是获取比率的正态近似值,并使用模拟确定何时适用(使用变异系数cv)。您的简历是否符合标准?如果是这样,则近似值适用。
ARS

1
@David:使用Marsaglia 1965代替答案中的更新。
ARS

注意:Marsaglia 于2004年在JSS中发布了更新
David LeBauer 2013年

XYZ=XYxyp(x,y)dxdy

0

y1N(.,.)

我在下面关于使用柯西的建议不起作用,正如ars和John的评论中指出的那样。

两个正常随机变量的比率遵循柯西分布。您可能希望使用此想法来确定最适合您所拥有数据的柯西参数。


一个。我需要估计方差,并且柯西分布的方差未定义。
大卫·勒鲍尔

b。如果我理解您的第二点,是的,我可以假设y-1〜N(mu,sigma),但是我仍然需要根据为y给出的汇总统计量来计算mu和sigma。同样,对于仅定义为> 0的变量,我选择不考虑值<0的分布(即使在许多情况下p(X <0 |
X〜N

柯西(Cauchy)是否不申请零平均法线?
ARS

@ars你是正确的。那么柯西可能用途有限。

Ars:是的,我相信Cauchy结果需要零均值。但这仍然意味着至少在这种特殊情况下,David试图估计的方差不存在。
John D. Cook 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.