Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。

2
贝叶斯事件研究方法的计量经济学
事件研究在经济学和金融学中很普遍,可以确定事件对股票价格的影响,但是它们几乎总是基于常识性推理。OLS回归-在与事件窗口不同的参考期间内-通常用于确定对资产的正常收益进行建模所需的参数。然后,在从到的指定事件窗口内的事件之后,确定资产上累积的异常收益()的统计显着性。假设检验用于确定这些收益是否显着并因此确实异常。从而:i T 1 T 2汽车CAR\text{CAR}一世iiŤ1个T1T_1Ť2T2T_2 H0:汽车一世= 0H0:CARi=0H_0 : \text{CAR}_i = 0,其中 汽车一世= ∑Ť2t = T1个增强现实我,Ť= ∑Ť2t = T1个([R我,Ť- è [ [R我,Ť] )CARi=∑t=T1T2ARi,t=∑t=T1T2(ri,t−E[ri,t])\text{CAR}_i = \sum_{t=T_1}^{T_2} \text{AR}_{i,t} = \sum_{t=T_1}^{T_2} \left( r_{i,t} -\mathbb{E}[r_{i,t}] \right)和 è [ [R我,Ť]E[ri,t]\mathbb{E}[r_{i,t}]是模型预测的资产收益。 如果我们的观察数量足够大,我们可以假定资产收益率分布的渐近正态性,但是对于较小的样本量可能无法验证。 可以说,因此,单企业,单事件的研究(例如在诉讼中要求的)应遵循贝叶斯方法,因为无限多次重复的假设比在这种情况下“更难以验证”多家公司。然而,频频主义者的做法仍然是惯例。 鉴于有关该主题的文献稀少,我的问题是如何使用贝叶斯方法最好地进行事件研究(类似​​于上面概述的方法,并在MacKinlay,1997年进行了总结)。 尽管这个问题是在公司财务实证研究的背景下提出的,但实际上是关于贝叶斯回归和推论的计量经济学,以及常识和贝叶斯方法背后的推理差异。特别: 我应该如何最好地使用贝叶斯方法来估计模型参数(假设对贝叶斯统计量有理论了解,但几乎没有经验)。 一旦计算出累积的异常收益(使用模型的正常收益),如何测试统计显着性? 如何在Matlab中实现呢?

1
使用多元正态和协变量的贝叶斯建模
假设您有一个解释变量,其中表示给定坐标。您还具有一个响应变量。现在,我们可以将两个变量组合为:X=(X(s1),…,X(sn))X=(X(s1),…,X(sn)){\bf{X}} = \left(X(s_{1}),\ldots,X(s_{n})\right)sssY=(Y(s1),…,Y(sn))Y=(Y(s1),…,Y(sn)){\bf{Y}} = \left(Y(s_{1}),\ldots,Y(s_{n})\right) W(s)=(X(s)Y(s))∼N(μ(s),T)W(s)=(X(s)Y(s))∼N(μ(s),T){\bf{W}}({\bf{s}}) = \left( \begin{array}{ccc}X(s) \\ Y(s) \end{array} \right) \sim N(\boldsymbol{\mu}(s), T) 在这种情况下,我们只需选择μ(s)=(μ1μ2)Tμ(s)=(μ1μ2)T\boldsymbol{\mu}(s) = \left( \mu_{1} \; \; \mu_{2}\right)^{T},TTT是一个协方差矩阵,描述了XXX和Y之间的关系YYY。这只能说明价值XXX和YYY在sss。由于我们从XXX和Y的其他位置获取了更多点YYY,因此可以通过以下方式描述{\ bf {W}}(s)的更多值W(s)W(s){\bf{W}}(s): (XY)=N((μ11μ21),T⊗H(ϕ))(XY)=N((μ11μ21),T⊗H(ϕ))\left( \begin{array}{ccc} {\bf{X}} \\ {\bf{Y}} \end{array}\right) = N\left(\left(\begin{array}{ccc}\mu_{1}\boldsymbol{1}\\ \mu_{2}\boldsymbol{1}\end{array}\right), T\otimes H(\phi)\right) 您会注意到,我们重新排列了XX\bf{X}和\ bf {Y}的组件,YY\bf{Y}以将所有X(si)X(si)X(s_i)放在一列中,然后将所有Y(s_i)串联Y(si)Y(si)Y(s_i)在一起。每个分量H(ϕ)ijH(ϕ)ijH(\phi)_{ij}是一个相关函数ρ(si,sj)ρ(si,sj)\rho(s_i, s_j),TTT等于上述值。之所以具有协方差T⊗H(ϕ)T⊗H(ϕ)T\otimes H(\phi)是因为我们假设可以将协方差矩阵分离为C(s,s′)=ρ(s,s′)TC(s,s′)=ρ(s,s′)TC(s, s')=\rho(s, s') T。 问题1:当我计算条件Y∣XY∣X{\bf{Y}}\mid{\bf{X}},实际上我正在 根据\ bf {X}生成一组\ bf {Y}值,对吗?我已经有\ …

1
贝叶斯定理错误应用的例子
这个Math Overflow社区问题询问“错误论证的例子,这些论证涉及在非数学环境中应用数学定理”,并产生了一系列有趣的病理学应用数学。 我想知道类似的贝叶斯推断在病理学上的应用实例。有没有人遇到学术文章,古怪的博客文章,这些文章以怪异的方式使用贝叶斯方法。
11 bayesian 



1
预测间隔=可信间隔?
我想知道预测间隔和可信间隔是否会评估同一件事。 例如,使用线性回归,当您估计拟合值的预测间隔时,您将估计期望值下降的间隔的极限。相反,与置信区间相反,您不会关注平均值等分布参数,而是会针对指定的X值(假设)来说明变量的取值。(1−α)%(1−α)%(1-\alpha)\% Y=a+b.X Y=a+b.X\ Y = a + b.X 当从后验概率分布中估计贝叶斯框架内给定值的拟合值时,可以估计可信区间。这个间隔是否为您提供了有关拟合值的相同信息?XXX


1
最大后验估计的示例
我一直在阅读有关最大似然估计和最大后验估计的信息,到目前为止,我仅遇到了有关最大似然估计的具体示例。我已经找到了一些最大后验估计的抽象示例,但是还没有具体的数字:S 它可能非常庞大,只使用抽象变量和函数,并且为了不被这种抽象淹没,不时将事物与现实世界联系起来是很好的。但是,当然,这只是我(和其他一些人)的观察:) 因此,有谁能给我一个简单但具体的例子,即关于最大后验估计的数字?那会很有帮助:) 谢谢! 我最初在MSE上发布了此问题,但无法在此处得到答案: /math/449386/example-of-maximum-a-posteriori-estimation 我已按照交叉发布此处的指示进行操作: http://meta.math.stackexchange.com/questions/5028/how-do-i-move-a-post-to-another-forum-like-cv-stats

1
回归系数的抽样分布
之前,我了解了采样分布,这些分布根据未知参数给出了供估计器使用的结果。例如,对于线性回归模型中和的采样分布β^0β^0\hat\beta_0β^1β^1\hat\beta_1Yi=βo+β1Xi+εiYi=βo+β1Xi+εiY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) 和 β^1∼N(β1, σ2Sxx)β^1∼N(β1, σ2Sxx) \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) 其中Sxx=∑ni=1(x2i)−nx¯2Sxx=∑i=1n(xi2)−nx¯2S_{xx} = \sum_{i=1}^n (x_i^2) -n \bar{x}^2 但是现在我在书中看到了以下内容: 假设我们以通常的方式用最小二乘法拟合模型。考虑贝叶斯后验分布,并选择先验,这样就等于通常的常客抽样分布,即…… (β0β1)∼N2[(β^1β^2), σ^2(n∑ni=1xi∑ni=1xi∑ni=1x2i)−1](β0β1)∼N2[(β^1β^2), σ^2(n∑i=1nxi∑i=1nxi∑i=1nxi2)−1] \left( \begin{matrix} \beta_0 \\ \beta_1 \end{matrix} \right) \sim \mathcal N_2\left[\left(\begin{matrix} \hat{\beta}_1 \\ \hat{\beta}_2 \end{matrix} …

1
Neg Binomial和Jeffreys的先验
我试图获得负二项式分布的Jeffreys先验。我看不到哪里出了问题,因此,如果有人可以指出这一点,将不胜感激。 好的,情况是这样的:我要比较使用二项式和负二项式获得的先验分布,(在两种情况下)都有试验且成功了。对于二项式情况,我得到了正确的答案,但是对于否定二项式,我没有得到正确的答案。nnnmmm 我们将其称为Jeffreys的先前。然后,πJ(θ)πJ(θ)\pi_J(\theta) πJ(θ)∝[I(θ)]1/2.πJ(θ)∝[I(θ)]1/2. \pi_J(\theta)\propto [I(\theta)]^{1/2}. 在常规条件下(在我们处理指数族时已实现), I(θ)=−E(∂2logL(θ|x)∂θ2)I(θ)=−E(∂2log⁡L(θ|x)∂θ2) I(\theta)=-E\left(\frac{\partial^2 \log L(\theta|x)}{\partial \theta^2}\right) 其中,负二项式n在上面nnn是xxx表达式(成功总数mmm是固定的,nnn不是固定的)。我认为分布是 p(m|θ)∝θm(1−θ)n−mp(m|θ)∝θm(1−θ)n−m p(m|\theta)\propto\theta^m(1-\theta)^{n-m} 因为θθ\theta被定义为成功的概率,而mmm 是成功的次数。这也是可能性,因为mmm是标量而不是向量。因此, L(θ|n)∝θm(1−θ)n−mlogL(θ|n)=mlogθ+(n−m)log(1−θ)∂logL(θ|n)∂θ=mθ−n−m1−θ∂2logL(θ|n)∂θ2=−mθ2−n−m(1−θ)2L(θ|n)∝θm(1−θ)n−mlog⁡L(θ|n)=mlog⁡θ+(n−m)log⁡(1−θ)∂log⁡L(θ|n)∂θ=mθ−n−m1−θ∂2log⁡L(θ|n)∂θ2=−mθ2−n−m(1−θ)2 L(\theta|n)\propto\theta^m(1-\theta)^{n-m}\\ \log L(\theta|n)=m\log\theta +(n-m)\log (1-\theta)\\ \frac{\partial\log L(\theta|n)}{\partial \theta}=\frac{m}{\theta}-\frac{n-m}{1-\theta}\\ \frac{\partial^2\log L(\theta|n)}{\partial \theta^2}=-\frac{m}{\theta^2}-\frac{n-m}{(1-\theta)^2} 因此Fisher信息是 I(θ)=−E(∂2logL(θ|n)∂θ2)=mθ2+E(n)−m(1−θ)2=mθ2+mθ1−θ−m(1−θ)2=m(1−θ)2+mθ3(1−θ)−mθ2θ2(1−θ)2=m(1−2θ)+mθ3(1−θ)θ2(1−θ)2=m(1−2θ)(1−θ)+mθ3θ2(1−θ)3=m(1−3θ+2θ2+θ3)θ2(1−θ)3∝1−3θ+2θ2+θ3θ2(1−θ)3I(θ)=−E(∂2log⁡L(θ|n)∂θ2)=mθ2+E(n)−m(1−θ)2=mθ2+mθ1−θ−m(1−θ)2=m(1−θ)2+mθ3(1−θ)−mθ2θ2(1−θ)2=m(1−2θ)+mθ3(1−θ)θ2(1−θ)2=m(1−2θ)(1−θ)+mθ3θ2(1−θ)3=m(1−3θ+2θ2+θ3)θ2(1−θ)3∝1−3θ+2θ2+θ3θ2(1−θ)3 I(\theta)=-E\left(\frac{\partial^2\log L(\theta|n)}{\partial \theta^2}\right)=\frac{m}{\theta^2}+\frac{E(n)-m}{(1-\theta)^2}=\frac{m}{\theta^2}+\frac{\frac{m\theta}{1-\theta}-m}{(1-\theta)^2}\\ =\frac{m(1-\theta)^2+\frac{m\theta^3}{(1-\theta)}-m\theta^2}{\theta^2(1-\theta)^2}=\frac{m(1-2\theta)+\frac{m\theta^3}{(1-\theta)}}{\theta^2(1-\theta)^2}\\ =\frac{m(1-2\theta)(1-\theta)+m\theta^3}{\theta^2(1-\theta)^3}=\frac{m(1-3\theta+2\theta^2+\theta^3)}{\theta^2(1-\theta)^3}\\ \propto\frac{1-3\theta+2\theta^2+\theta^3}{\theta^2(1-\theta)^3} 但是,这不能给我正确的答案。正确答案是 πJ(θ)∝1θ(1−θ)1/2πJ(θ)∝1θ(1−θ)1/2 \pi_J(\theta)\propto \frac{1}{\theta(1-\theta)^{1/2}} ,这意味着我得到的信息应该是 I(θ)=1θ2(1−θ)I(θ)=1θ2(1−θ) I(\theta)=\frac{1}{\theta^2(1-\theta)} 因为先验应与信息的平方根成比例。 谁能发现任何错误?如果我搞砸了发行版的设置(成功与失败以及各自的概率,等等),我不会感到惊讶。 我使用了Wikipedia的期望值,并且从这里知道正确的答案(第3页)。

4
贝叶斯无信息先验与惯常主义原假设:是什么关系?
我在这里的博客文章中看到了这张图片。 令我感到失望的是,阅读这份声明并没有像我给这个家伙带来同样的面部表情。 那么,零假设是频繁主义者如何表达无信息先验的陈述意味着什么?是真的吗 编辑:我希望有人可以提供一个慈善的解释,使这个说法正确,即使从某种意义上来说也是这样。


1
ABC型号选择
已经表明,不建议使用贝叶斯因数选择ABC模型,因为存在使用汇总统计数据产生的错误。本文的结论依赖于一种流行的方法的行为的近似贝叶斯因子(算法2)的研究。 众所周知,贝叶斯因素并不是进行模型选择的唯一方法。还有其他一些功能,例如模型的预测性能,可能会引起关注(例如评分规则)。 我的问题是:是否有一种类似于算法2的方法,可以根据复杂情况下的预测性能,近似一些计分规则或其他可用于进行模型选择的数量?

1
贝叶斯网络中的马尔可夫毯与正常依存关系
当我阅读贝叶斯网络时,我遇到了“ 马尔可夫毯 ”一词,并对其在贝叶斯网络图中的独立性感到困惑。 马尔可夫毯子简短地说,每个节点仅依赖于其父代,子代和子代父代(图中节点A的灰色区域)。 这个BN,的联合概率是多少?P(M,S,G,I,B,R)P(M,S,G,I,B,R)P(M,S,G,I,B,R) (来源:aiqus.com) 如果我遵循步骤“仅父项”独立规则,则为: P(M|S)P(S|G,I)P(I|B)P(R|B)P(G)P(B)P(M|S)P(S|G,I)P(I|B)P(R|B)P(G)P(B) P(M | S)P(S | G,I)P(I | B)P(R | B)P(G)P(B) 但是,如果遵循马尔可夫毯子独立性,则会得出此结果(注意是不同的):P(I|G,B)P(I|G,B)P(I|\mathbf{G},B) P(M|S)P(S|G,I)P(I|G,B)P(R|B)P(G)P(B)P(M|S)P(S|G,I)P(I|G,B)P(R|B)P(G)P(B)P(M | S)P(S | G,I)P(I | \mathbf{G},B)P(R | B)P(G)P(B) 那么,这个国阵的正确联合概率是多少? 更新:AIQUS中此问题的交叉链接 和 以下各章和图表: 替代文字http://img828.imageshack.us/img828/9783/img0103s.png 替代文字http://img406.imageshack.us/img406/3788/img0104l.png

2
方差不相等的两个样本t检验的贝叶斯对应物是什么?
我正在寻找方差不相等的两个样本t检验的贝叶斯对应物(韦尔奇检验)。我也在寻找多变量检验,例如Hotelling的T统计量。参考文献表示赞赏。 对于多元情况,假设我们有和(z 1,⋯ ,z N),其中y i(resp z i)是样本均值,样本标准差和数量的捷径点。我们可以假设点数在整个数据集中是恒定的,所有y i的标准偏差都相同(resp z i),并且y i的样本均值(resp z i)(y1个,⋯ ,yñ)(y1,⋯,yN)(y_1,\cdots,y_N)(z1个,⋯ ,zñ)(z1,⋯,zN)(z_1,\cdots,z_N)ÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_i)是相关的。如果绘制样本均值,它们将彼此跟随并通过连接它们,您将获得平滑的变化函数。现在,在一些地方功能与同意ž功能,但别人没有,因为米Ë 一个ñ (Ÿ 我)- 米Ë 一个ñ (ž 我)yyyzzz变大。我想对此陈述进行量化。 mean(yi)−mean(zi)std(yi)+std(zi)mean(yi)−mean(zi)std(yi)+std(zi)\frac{mean(y_i)-mean(z_i)}{std(y_i)+std(z_i)}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.