Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。

3
进行线性回归时,斜率的无先验信息是什么?
在执行贝叶斯线性回归时,需要为坡度分配先验并截取。由于是位置参数,因此分配统一的先验是有意义的;但是,在我看来,类似于比例尺参数,并且在其之前分配制服似乎是不自然的。aaabbbbbbaaa 另一方面,为线性回归的斜率分配通常没有信息的杰弗里·普雷尔()似乎不太正确。首先,它可以是负数。但是我看不出还有什么可能。1/a1/a1/a 那么,贝叶斯线性回归的斜率的“适当”先验信息是什么?(任何参考文献将不胜感激。)

1
重新设置似然函数的参数时,仅插入转换后的变量而不是更改变量公式就足够了吗?
假设我正在尝试重新设定指数分布的似然函数的参数。如果我的原始似然函数是: p(y∣θ)=θe−θyp(y∣θ)=θe−θy p(y \mid \theta) = \theta e^{-\theta y} 并且我想使用重新设置参数,因为不是随机变量,而是参数,仅用于插入就足够了吗?ϕ=1θϕ=1θ\phi = \frac{1}{\theta}θθ\theta 我的明确意思是: p(y∣ϕ=1θ)=1ϕe−1ϕyp(y∣ϕ=1θ)=1ϕe−1ϕy p\left(y \mid \phi = \frac{1}{\theta}\right) = \frac{1}{\phi} e^{-\frac{1}{\phi} y} 如果是这样,我不确定这背后的理论是什么。我的理解是,似然函数是参数的函数,所以为什么我不需要使用变量公式的变化使我感到困惑。任何帮助将不胜感激,谢谢!

1
Bayesglm(手臂)与MCMCpack
双方bayesglm()(在手臂[R封装)和各种功能的MCMCpack包的目的是做广义线性模型的贝叶斯估计,但我不知道他们实际上是计算同样的事情。MCMCpack函数使用马尔可夫链蒙特卡罗方法从关节后部获得模型参数的(相关)样本。bayesglm()另一方面,产生。我不确定。 看起来像bayesglm()产生一个点估计,这将使其成为MAP(最大后验)估计,而不是完整的贝叶斯估计,但是sim()似乎有一个函数可用于获取后验绘制。 有人可以解释两者的预期用途的区别吗?可以bayesglm() + sim()产生真实的后验图,还是某种近似?

3
MCMC和PyMC的2高斯混合模型推论
问题 我想拟合简单的2高斯混合总体的模型参数。考虑到围绕贝叶斯方法的所有炒作,我想了解贝叶斯推断是否比传统拟合方法更好。 到目前为止,MCMC在此玩具示例中的表现非常差,但也许我只是忽略了一些东西。因此,让我们看一下代码。 工具 我将使用python(2.7)+ scipy堆栈,lmfit 0.8和PyMC 2.3。 可以在此处找到重现分析的笔记本 产生数据 首先让我们生成数据: from scipy.stats import distributions # Sample parameters nsamples = 1000 mu1_true = 0.3 mu2_true = 0.55 sig1_true = 0.08 sig2_true = 0.12 a_true = 0.4 # Samples generation np.random.seed(3) # for repeatability s1 = distributions.norm.rvs(mu1_true, sig1_true, size=round(a_true*nsamples)) s2 = …

3
什么时候终止贝叶斯A / B测试?
我正在尝试对贝叶斯方法进行A / B测试,就像在针对黑客的概率编程和贝叶斯A / B测试中一样。这两篇文章都假定决策者仅根据某些准则(例如的概率来决定哪个变量更好,因此更好。这种可能性无法提供有关是否有足够数据量可以得出任何结论的任何信息。因此,我不清楚何时停止测试。P(p一个> p乙)= 0.97P(pA>pB)=0.97P(p_A > p_B) = 0.97 一个AA 假设有两个二进制RV,即和,我想根据和的观察来估计和的可能性是多少。此外,假设和是beta分布的。B p A > p B一个AA乙BBp一个> p乙pA>pB p_A > p_B ABpApBp一个- p乙p一个> 5 %pA−pBpA>5% \frac{p_A - p_B}{p_A} > 5\% 一个AA乙BBp一个pAp_Ap乙pBp_B 由于我可以找到和的参数,可以对后验样本进行采样,并估计。python中的示例:p 甲α ,βα,β\alpha, \betap Bp一个|数据pA|datap_A\,|\,\text{data} P (p A > p B | data )p乙|数据pB|datap_B\,|\,\text{data} P(p一个> p乙 | 数据) …

2
相同还是不同?贝叶斯方法
说我有以下模型: Poisson(λ)∼{λ1λ2if t<τif t≥τPoisson(λ)∼{λ1if t<τλ2if t≥τ\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases} 我从数据中推断出下面所示的和。是否存在贝叶斯方法来判断(或量化)和是相同还是不同?λ 2 λ 1 λ 2λ1λ1\lambda_1λ2λ2\lambda_2λ1λ1\lambda_1λ2λ2\lambda_2 也许可以测量与不同的概率λ 2λ1λ1\lambda_1λ2λ2\lambda_2?还是使用KL散度? 例如,如何测量或至少?p (λ 2 > λ 1)p(λ2≠λ1)p(λ2≠λ1)p(\lambda_2 \neq \lambda_1)p(λ2>λ1)p(λ2>λ1)p(\lambda_2 \gt \lambda_1) 总的来说,一旦您获得了如下所示的后验者(假设两者的PDF值到处都是非零值),那么回答这个问题的好方法是什么? 更新资料 这个问题似乎可以通过两种方式回答: 如果我们有后验的样本,我们可以查看(或等效地 )中样本的比例。@ Cam.Davidson.Pilon提供了一个答案,可以使用此类样本解决此问题。λ 2 > …

2
有什么很好的类比来说明分层贝叶斯模型的优势?
我是贝叶斯统计的新手,最近一直在使用JAGS在不同的数据集上构建分层贝叶斯模型。尽管我对结果非常满意(与标准的glm模型相比),但我需要向非统计人员解释与标准统计模型的区别。特别是,我想说明为什么和何时HBM的性能优于简单模型。 类比很有用,尤其是说明一些关键要素的类比: 多层次的异质性 需要更多计算以适合模型 从相同数据中提取更多“信号”的能力 请注意,答案确实应该是对非统计人员的启发,而不是简单易懂的示例。

4
混合模型思想与贝叶斯方法
在混合模型中,我们假设随机效应(参数)是遵循正态分布的随机变量。它看起来与贝叶斯方法非常相似,在贝叶斯方法中,所有参数均假定为随机参数。 那么随机效应模型是贝叶斯方法的特例吗?


2
用于非参数聚类的PyMC:估计高斯混合参数的Dirichlet过程无法聚类
问题设定 我想将PyMC应用到的第一个玩具问题之一是非参数聚类:给定一些数据,将其建模为高斯混合,并学习聚类的数目以及每个聚类的均值和协方差。我对这种方法的大部分了解来自迈克尔·乔丹(Michael Jordan)和Yee Whye Teh(大约在2007年之前)的视频讲座(在稀疏成为流行之前),以及最近两天阅读Fonnesbeck博士和E. Chen的教程[fn1],[ fn2]。但是问题已得到充分研究,并且具有一些可靠的实现方式[fn3]。 在这个玩具问题中,我从一维高斯生成十次抽奖,并从。正如您在下面看到的那样,我没有对抽奖进行混洗,以便于分辨哪个样品来自哪个混合成分。N(μ = 4 ,σ = 2 )N(μ=0,σ=1)N(μ=0,σ=1)\mathcal{N}(\mu=0, \sigma=1)N(μ=4,σ=2)N(μ=4,σ=2)\mathcal{N}(\mu=4, \sigma=2) 我对每个数据样本进行,,其中表示该第个数据点的聚类:。是使用的截短Dirichlet进程的长度:对我来说,。我= 1 ,。。。,50 ž 我我ž 我 ∈ [ 1 ,。。。,N D P ] N D P N D P = 50yi∼N(μzi,σzi)yi∼N(μzi,σzi)y_i \sim \mathcal{N}(\mu_{z_i}, \sigma_{z_i})i=1,...,50i=1,...,50i=1,...,50ziziz_iiiizi∈[1,...,NDP]zi∈[1,...,NDP]z_i \in [1,...,N_{DP}]NDPNDPN_{DP}NDP=50NDP=50N_{DP}=50 扩展Dirichlet流程基础结构,每个集群ID都是来自分类随机变量的图形,其随机变量的质量函数由结构给出:带有的a浓度参数。折断构造通过首先获得依赖于 Beta分布的 iid Beta分布绘制,构造必须为1 的长向量,请参见[fn1]。并且由于我想通过数据告知我对了解,因此我遵循[fn1]并假定 0.3,100。ž 我〜Ç 一吨ë …


3
如何可视化贝叶斯拟合优度进行逻辑回归
对于贝叶斯逻辑回归问题,我创建了后验预测分布。我从预测分布中进行采样,对于每个观测值,我都会收到数千个(0,1)的采样。可视化拟合优度并不有趣,例如: 此图显示了1万个样本+观察到的基准点(左侧的一条可以画出一条红线:是的,是观察值)。问题在于该图很难提供信息,我将使用其中的23个,每个数据点一个。 是否有更好的方法可视化23个数据点以及后面的样本。 另一尝试: 基于纸张的另一种尝试这里

2
如何使用BUGS / JAGS / STAN为比例建模?
我正在尝试建立一个模型,其中回应是一个比例(实际上是政党在选区中获得的选票份额)。它的分布不正常,因此我决定使用beta分布对其进行建模。我也有几个预测指标。 但是,我不知道如何用BUGS / JAGS / STAN编写它(JAGS是我最好的选择,但这并不重要)。我的问题是我通过预测变量对参数求和,但是该怎么办呢? 代码将是这样的(使用JAGS语法),但是我不知道如何“链接” y_hat和y参数。 for (i in 1:n) { y[i] ~ dbeta(alpha, beta) y_hat[i] <- a + b * x[i] } (y_hat只是参数和预测变量的乘积,因此是确定性关系。a并且b是我试图估计的系数,x作为预测变量)。 感谢您的建议!

1
先验条件不正确的贝叶斯因素
我有一个关于使用贝叶斯因子进行模型比较的问题。在许多情况下,统计学家对使用贝叶斯方法使用不适当的先验条件(例如某些Jeffreys先验条件和参考先验条件)感兴趣。 我的问题是,在模型参数的后验分布定义明确的情况下,在使用不正确的先验条件下使用贝叶斯因子比较模型是否有效? 作为一个简单的示例,请考虑将普通模型与Logistic模型与Jeffreys Priors进行比较。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.