Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。

2
结合来自多项研究的信息以估计正态分布数据的均值和方差-贝叶斯与荟萃分析方法
我已经审查了一组论文,每个论文都报告了在已知大小相应样本中的观测值的平均值和SD 。我想对我正在设计的一项新研究中同一度量的可能分布进行最大可能的猜测,以及该猜测的不确定性。我很高兴假设)。XXXññnX〜ñ(μ , σ2X〜ñ(μ,σ2X \sim N(\mu, \sigma^2 我的第一个想法是荟萃分析,但是通常使用的模型着重于点估计和相应的置信区间。但是,我想说一些关于充分分布,在这种情况下也将包括作出的猜测有关的方差,σ 2。 XXXσ2σ2\sigma^2 我一直在阅读有关根据先验知识估算给定分布的完整参数集的可能的Bayeisan方法。通常,这对我来说更有意义,但是我对贝叶斯分析的经验为零。这似乎是一个直截了当,相对简单的问题。 1)考虑到我的问题,哪种方法最有意义,为什么?荟萃分析还是贝叶斯方法? 2)如果您认为贝叶斯方法是最好的,您能指出我一种实现此方法的方法(最好在R中)吗? 相关问题 编辑: 我一直试图以我认为是“简单”的贝叶斯方式来解决这个问题。 正如我如上所述,我不只是有兴趣在估计平均,,而且方差,σ 2,在光的事先信息,即P (μ ,σ 2 | ÿ )μμ\muσ2σ2\sigma^2P(μ , σ2| ÿ)P(μ,σ2|ÿ)P(\mu, \sigma^2|Y) 同样,我对实践中的贝叶斯主义一无所知,但是不久之后,发现均值和方差未知的正态分布的后部通过共轭具有正态-反伽马分布的封闭形式解。 问题是重新表述为。P(μ , σ2| ÿ)= P(μ | σ2,Y)P(σ2| ÿ)P(μ,σ2|ÿ)=P(μ|σ2,ÿ)P(σ2|ÿ)P(\mu, \sigma^2|Y) = P(\mu|\sigma^2, Y)P(\sigma^2|Y) 估计与正常分布; P (σ 2 | Ý )与逆伽马分布。P(μ | σ2,Y)P(μ|σ2,ÿ)P(\mu|\sigma^2, …

3
具有共轭先验:深性质还是数学事故?
有些分布具有共轭先验,有些则没有。这种区别仅仅是偶然吗?就是说,您进行数学运算,它可以以一种方式或另一种方式进行计算,但是除了事实本身之外,它没有真正告诉您关于分布的任何重要信息吗? 还是共轭先验的存在与否反映了分布的某些更深层次的性质?具有共轭先验的分布是否共享一些其他有趣的特性,或者其他分布所缺少的特性导致那些分布(而不是其他)具有共轭先验?

1
人们用于贝叶斯推理的教科书MCMC算法有哪些众所周知的改进?
当我为某些问题编写蒙特卡洛模拟代码时,并且该模型非常简单,我使用了非常基础的教科书Gibbs采样。当无法使用Gibbs采样时,我编写了几年前学到的教科书Metropolis-Hastings。我对此的唯一想法是选择跳跃分布或其参数。 我知道有成百上千的专门方法可以改善这些教科书的选择,但我通常从不考虑使用/学习它们。通常感觉是要付出很多努力来改善已经很好地进行的工作。 但是最近我一直在思考,也许没有新的通用方法可以改善我一直在做的事情。自从发现这些方法以来已有数十年了。也许我真的过时了! 有没有众所周知的替代Metropolis-Hasting的方法: 相当容易实现, 像MH一样普遍适用 并始终在某种意义上提高MH的结果(计算性能,准确性等)? 我知道针对非常专业的模型进行了一些非常专业的改进,但是每个人都使用一些我不知道的常规知识吗?

1
基于MCMC的回归模型中的残留诊断
我最近开始使用MCMC算法(实际上是R中的MCMCglmm函数)在贝叶斯框架中拟合回归混合模型。 我相信我已经了解了如何诊断估计过程的收敛性(迹线,geweke图,自相关,后验分布...)。 在贝叶斯框架中给我留下深刻印象的一件事是,似乎花了很多精力来进行这些诊断,而在检查拟合模型的残差方面却似乎做得很少。例如,在MCMCglmm中,确实存在残留的.mcmc()函数,但实际上尚未实现(即返回:“尚未为MCMCglmm对象实现的残留物”; predict.mcmc()的情况相同)。在其他软件包中似乎也缺少它,而且在我发现的文献中,除讨论广泛的DIC之外,它几乎没有被讨论过。 谁能指出一些有用的参考,理想情况下,我可以使用或修改R代码? 非常感谢。

2
如何在学习算法之间进行选择
我需要实现一个程序,根据一些训练数据将记录分为两类(对/错),我想知道应该查看哪种算法/方法。似乎有很多可供选择的选择-人工神经网络,遗传算法,机器学习,贝叶斯优化等,而我不确定从哪里开始。因此,我的问题是: 我应该如何选择应该用于问题的学习算法? 如果有帮助,这是我需要解决的问题。 训练数据: 训练数据由许多行组成,如下所示: Precursor1, Precursor2, Boolean (true/false) 运行 我会给出一堆的前体。 然后, 我从不同的算法中选择一种算法A(或动态生成一种算法),并将其应用于这些前体的每种可能组合,并收集发出的“记录”。“记录”由几个键值对*组成。 我应用了一些很棒的算法,并将这些记录分为2类(对/错)。 我将生成一个与火车数据具有相同格式的表: Precursor1, Precursor2, Boolean 整个程序的评分是基于我正确判断对错的几率。 *:“记录”看起来像这样(希望这样有意义) Record [1...*] Score -Precursor1 -Key -Precursor2 -Value 只有有限数量的可能的键。记录包含这些键的不同子集(某些记录具有key1,key2,key3 ...,其他记录具有key3,key4 ...等)。 我实际上需要2学习。一个是针对第1步的。我需要一个模块来查看Precursor对等,并确定要应用哪种算法才能发出比较记录。另一个是针对步骤2的。我需要一个模块来分析记录的收集并将它们分类为2个类别(对/错)。 先感谢您!

5
测量理论导论
我有兴趣了解有关非参数贝叶斯(及相关)技术的更多信息。我的背景是计算机科学,尽管我从未参加过度量理论或概率论的课程,但是我对概率和统计学的正规培训数量有限。谁能推荐这些概念的可读介绍来帮助我入门?


2
如何总结医疗对象的合理间隔
使用Stan和frontend软件包,rstanarm或者brms像以前一样,我可以像以前一样轻松地以贝叶斯方式分析数据lme。虽然我桌上有Kruschke-Gelman-Wagenmakers等的大部分书籍和文章,但这些内容并没有告诉我如何总结医学观众的结果,这些结果困扰于贝叶斯愤怒的Skylla和医学评论家的Charybdis( “我们需要意义,而不是那些分散的东西”)。 例如:胃频率(1 / min)分为三组;健康对照是参考。每个参与者都有几种度量,因此常客我使用以下混合模型lme: summary(lme(freq_min~ group, random = ~1|study_id, data = mo)) 略有修改的结果: Fixed effects: freq_min ~ group Value Std.Error DF t-value p-value (Intercept) 2.712 0.0804 70 33.7 0.0000 groupno_symptoms 0.353 0.1180 27 3.0 0.0058 groupwith_symptoms 0.195 0.1174 27 1.7 0.1086 为简单起见,我将使用2 * std错误作为95%CI。 在常客的背景下,我将其总结为: 在对照组中,估计频率为2.7 / min(也许在此处添加CI,但由于绝对和差异CI造成的混淆,我有时会避免这样做)。 在no_symptoms组中,频率比对照组高0.4 …

2
为什么方差上的被认为是弱的?
背景 最常用的方差弱先验之一是反伽玛,其参数(Gelman 2006)。α = 0.001 ,β= 0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 但是,此分布的90%CI约为。[ 3 × 1019,∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf 据此,我认为给出方差非常高的可能性很小,而方差小于1可能性很低。一世ģ (0.001 ,0.001 )IG(0.001,0.001)IG(0.001, 0.001)P(σ&lt; 1 | α = 0.001 ,β= 0.001 )= 0.006P(σ&lt;1|α=0.001,β=0.001)=0.006P(\sigma<1|\alpha=0.001, \beta=0.001)=0.006 pigamma(1, 0.001, 0.001) [1] 0.006312353 题 我是否缺少某些东西,或者这实际上是一个有用的信息? 更新以澄清,我之所以考虑这个“信息性”,是因为它非常强烈地声称方差巨大,并且远远超出了曾经测量的几乎任何方差的范围。 后续的大量方差估计的荟萃分析是否可以提供更合理的先验? 参考 Gelman2006。层次模型中方差参数的先验分布。贝叶斯分析1(3):515–533

1
从贝叶斯网络到神经网络:如何将多元回归转换为多输出网络
我正在处理贝叶斯层次线性模型,这里是描述它的网络。 ÿYY代表超市中某产品的每日销售额(已观察)。 XXX是已知的回归矩阵,包括价格,促销,星期几,天气,假期。 1小号SS是每种产品的未知潜在库存水平,这会导致最多的问题,并且我认为是二进制变量的向量,每个产品一个,其中表示缺货,因此该产品不可用。 即使在理论上未知,我也通过HMM对每个产品进行了估算,因此可以将其视为X。我只是为了适当的形式主义而决定对它进行着色。1个11 ηη\eta是任何单个产品的混合效果参数,其中考虑的混合效果是产品价格,促销和缺货。 b 1 b 2ββ\beta是固定回归系数的向量,而和是混合效应系数的向量。一组代表品牌,另一组代表风味(这是一个例子,实际上我有很多组,但是为了清楚起见,这里我只报告两个)。b1个b1b_1b2b2b_2 Σ b 1 Σ b 2ΣηΣη\Sigma_{\eta},和是混合效果的超参数。Σb1个Σb1\Sigma_{b_1}Σb2Σb2\Sigma_{b_2} 因为我有计数数据,所以可以说我将每个产品的销售额都视泊松分布在回归变量上的条件而定(即使对于某些产品,线性近似成立,而对于其他产品,零膨胀模型更好)。在这种情况下,我将有一个乘积(这仅适用于那些对贝叶斯模型本身感兴趣的人,如果您发现它不感兴趣或不琐碎,请跳至该问题:)):ÿYY Ση〜我w ^(α0,γ0)Ση∼IW(α0,γ0)\Sigma_{\eta} \sim IW(\alpha_0,\gamma_0) Σb1个〜我w ^(α1个,γ1个)Σb1∼IW(α1,γ1)\Sigma_{b_1} \sim IW(\alpha_1,\gamma_1) α 0,γ 0,α 1,γ 1,α 2,γ 2Σb2〜我w ^(α2,γ2)Σb2∼IW(α2,γ2)\Sigma_{b_2} \sim IW(\alpha_2,\gamma_2),已知。α0,γ0,α1个,γ1个,α2,γ2α0,γ0,α1,γ1,α2,γ2\alpha_0,\gamma_0,\alpha_1,\gamma_1,\alpha_2,\gamma_2 η〜ñ(0,Ση)η∼N(0,Ση)\eta \sim N(\mathbf{0},\Sigma_{\eta}) b1个〜ñ(0,Σb1个)b1∼N(0,Σb1)b_1 \sim N(\mathbf{0},\Sigma_{b_1}) b2〜ñ(0,Σb2)b2∼N(0,Σb2)b_2 \sim N(\mathbf{0},\Sigma_{b_2}) &Sigma; ββ〜ñ(0,Σβ)β∼N(0,Σβ)\beta \sim N(\mathbf{0},\Sigma_{\beta}),已知。ΣβΣβ\Sigma_{\beta} λ吨我Ĵ ķ= …

2
吉布斯采样与常规MH-MCMC
我一直在阅读有关Gibbs采样和Metropolis Hastings算法的文章,并有几个问题。 据我了解,在吉布斯抽样的情况下,如果我们有一个大的多元问题,我们从条件分布中抽样,即抽样一个变量,而其他变量保持不变,而在MH中,我们从整个联合分布抽样。 该文件说的一件事是,建议的样本始终在Gibbs抽样中接受,即建议的接受率始终为1。对我来说,这似乎是一个很大的优势,因为对于大型多元问题,MH算法的拒绝率似乎变得很大。如果确实如此,那么为什么一直不使用Gibbs Sampler来生成后验分布的原因是什么?

2
贝叶斯生存分析:请给我写一份Kaplan Meier的事前书!
考虑右审查意见,与事件在时间。在时间i处易感个体的数量为n i,在时间i处事件的数量为d i。t1,t2,…t1,t2,…t_1, t_2, \dotsiiininin_iiiididid_i 的卡普兰-迈耶或产品估计自然的用MLE当生存函数是一个阶跃函数。的可能性然后 大号(α )= Π我(1 - α 我)d 我 α Ñ 我 - d 我我 和MLE是α我 = 1 - d 我S(t)=∏i:ti&lt;tαiS(t)=∏i:ti&lt;tαiS(t) = \prod_{i : t_i < t} \alpha_iL(α)=∏i(1−αi)diαni−diiL(α)=∏i(1−αi)diαini−di L(\alpha) = \prod_i (1-\alpha_i)^{d_i} \alpha_i^{n_i-d_i} 。αˆi=1−diniα^i=1−dini\widehat\alpha_i = 1 - {d_i\over n_i} 好的,现在假设我想去贝叶斯算法。我需要先乘某种``自然'' 对吧?L(α)L(α)L(\alpha) 搜寻明显的关键字后,我发现Dirichlet流程是一个很好的先决条件。但是据我了解,它也是不连续点上的先验。titit_i 这当然很有趣,我很想学习,但是我会选择更简单的方法。我开始怀疑这并不像我最初想象的那么容易,是时候征求您的建议了... 提前谢谢了! PS:什么我希望一些精密我感兴趣的(越简单越好)约前处理Dirichlet过程的方式解释,不过我想应该是可以使用简单地事先对 -这是阶跃函数在t …

3
陪审员基本统计
我被传唤出任陪审员。我意识到统计数字与某些陪审团审判的相关性。例如,“基准利率”的概念及其在概率计算中的应用有时(也许总是)是相关的。 在我所处的情况下,一个人可以学习哪些统计主题,哪些材料适合我的背景? 我拥有“硬科学”学位,因此统计知识有限,但是我的技能很生锈。我全职工作,没有很多时间来做陪审团。因此,将答案集中在基本概念,简单的问题解决技能及其在相关问题上的应用(当然,以及这些概念和方法的局限性)将是适当的。

2
多次插补后如何合并后均值和可信区间?
我使用多重插补来获得许多完整的数据集。 我已经在每个完整的数据集上使用贝叶斯方法来获取参数的后验分布(随机效应)。 如何合并/合并此参数的结果? 更多内容: 就个别学生(每个学生一个观察)聚集在学校的意义而言,我的模型是分层的。我对数据进行了多次插补(MICE在R中使用),我将其school作为丢失数据的预测变量之一包括在内-试图将数据层次结构合并到插补中。 我已经为每个完整的数据集拟合了一个简单的随机斜率模型(MCMCglmm在R中使用)。结果是二进制的。 我发现随机斜率方差的后验密度在某种意义上是“表现良好的”: 对于这种随机效应,如何合并/合并来自每个估算数据集的后均值和可信区间? 更新1: 据我到目前为止的了解,我可以将鲁宾的规则应用于后验均值,以给出一个倍增的后验均值-这样做有什么问题吗?但是我不知道如何合并95%的可信区间。另外,由于每个插补都有一个实际的后验密度样本-我可以以某种方式将它们组合吗? Update2: 根据@cyan在评论中的建议,我非常喜欢简单地组合从多个插补的每个完整数据集获得的后验分布样本的想法。但是,我想知道这样做的理论依据。

6
“完全贝叶斯”与“贝叶斯”
我一直在学习贝叶斯统计,并且经常在文章中阅读 “我们采用贝叶斯方法” 或类似的东西。我还注意到,很少出现: “我们采用完全贝叶斯方法” (我的重点)。这些方法在实践或理论上有什么区别吗?FWIW,如果需要的话,我MCMCglmm在R中使用该软件包。
20 bayesian 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.