问题: 我正在参数化分布,以用作贝叶斯元分析中的先验和数据。数据在文献中以摘要统计的形式提供,几乎专门假定为正态分布(尽管所有变量均不能小于0,某些变量是比率,某些变量是质量,等等)。
我遇到了两种情况,但我没有解决方案。有时感兴趣的参数是数据的倒数或两个变量的比率。
例子:
- 两个正态分布变量的比率:
- 数据:氮和碳百分比的平均值和标准偏差
- 参数:碳氮比。
- 正态分布变量的倒数:
- 数据:质量/面积
- 参数:面积/质量
我当前的方法是使用仿真:
例如,对于一组碳和氮百分比数据,均值:xbar.n,c,方差:se.n,c,样本大小:nn,nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
我想参数化ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
然后为我的先前选择范围为的最佳拟合分布
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
问题: 这是有效的方法吗?还有其他/更好的方法吗?
提前致谢!
Hayya,J.和Armstrong,D.和Gressis,N.,1975年。关于两个正态分布变量之比的注释。管理科学21:1338--1341
我应该将有关计算柯西随机抽签方差的更新问题作为一个单独的问题发布吗?
—
戴维·勒鲍尔