Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。





3
帮助我了解贝叶斯先验和后验分布
在一组学生中,有18个学生中有2个是惯用左手的。假设先验信息不足,则找到惯用左手的学生在人群中的后验分布。总结结果。根据文献,5-20%的人是左撇子。事先考虑这些信息并计算新的后验。 我知道应该在这里使用beta发行版。首先,αα\alpha和ββ\beta值为1?我在后验材料中找到的等式是 π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2,N=18N=18N=18 为什么方程式中的?(rrrrrr表示惯用左手的人的比例)。这是未知的,那么怎么在等式中呢?对我来说,似乎是可笑的计算rrr给出并使用方程给出的。好吧,对于样本 2/18,结果为0,0019。该˚F我应该从演绎?YYYrrrrrrr=2/18r=2/18r=2/180,00190,00190,0019fff 在已知和,给出的期望值的方程更好地工作,给了我,这听起来很正确。方程为其中值分配给和。考虑到先验信息,我应该给和提供什么值?RRRYYYNNN0,150,150,15E(r|X,N,α,β)=(α+X)/(α+β+N)E(r|X,N,α,β)=(α+X)/(α+β+N)E(r | X, N, α, β) = (α + X)/(α + β + N)111αααβββαααβββ 一些提示将不胜感激。关于先验和后验分布的一般性演讲也不会受到伤害(我含糊其词,但含糊其词)也要记住,我不是一个非常高级的统计学家(实际上,我是主要行业的政治学家),所以高等数学可能会飞过我的脑海。

13
XKCD的Frequentists vs.Bayesians漫画有什么问题?
这张xkcd漫画(Frequentists vs. Bayesians)取笑了一个得出明显错误结果的常客统计学家。 然而,在我看来,他的推理实际上是正确的,因为它遵循标准的频繁论者方法。 所以我的问题是“他是否正确地采用了常客主义方法?” 如果否:在这种情况下正确的常客推断是什么?如何将有关太阳稳定性的“先验知识”整合到频率论方法中? 如果是:wtf?;-)

8
ASA讨论了限制-有哪些替代方案?
我们已经有多个线程标记为p值,这些线程揭示了许多关于它们的误解。十个月前,我们有一个线程关于心理杂志,“禁止” -值ppp p,现在美国统计协会(2016)指出,与我们的分析,我们“不应该用的计算结束 -值”。ppp 美国统计协会(ASA)认为,科学界可以从一份正式声明中受益,该声明阐明了一些正确使用和解释值的公认原则。ppp 该委员会列出了其他方法作为可能替代或补充:ppp 鉴于普遍存在对误用和误解 ,一些统计学家倾向于用其他方法来补充甚至替代 。这些方法包括强调评估而不是测试的方法,例如置信度,可信度或预测间隔;贝叶斯方法;替代的证据度量,例如似然比或贝叶斯因子;以及其他方法,例如决策理论建模和错误发现率。所有这些措施和方法都依赖于进一步的假设,但它们可能更直接地解决效应的大小(及其相关的不确定性)或假设是否正确。 ppppppp 因此,让我们想象一下后的现实。ASA列出了一些可以代替,但是为什么它们更好?对于一生使用的研究人员,其中哪一个可以代替他?我想,这样的问题会出现在后 -值的现实,所以也许我们尽量在他们面前的一个步骤。可以直接使用的合理替代方法是什么?为什么这种方法应该说服您的首席研究员,编辑或读者?p p ppppppppppppp 正如此后续博客条目所建议的那样,在其简单性方面无与伦比:ppp p值只需要一个统计模型,即可统计要保留的原假设下的统计行为。即使使用替代假设的模型来选择“良好”统计量(将用于构造p值),该替代模型也不必正确才能使p值有效,并且有用(即:控制I型错误在期望的水平上,同时提供检测实际效果的能力)。相比之下,其他(出色且有用的)统计方法(如似然比,效果大小估计,置信区间或贝叶斯方法)都需要假定的模型来保持更广泛的情况,而不仅是在经过测试的零值下。 是它们,还是不正确,我们可以轻松地替换它们? 我知道,这是广义的,但主要问题很简单:什么是可以替代的值的最佳(以及为什么)现实生活中的替代方法?ppp ASA(2016)。ASA关于统计意义和声明。PPP 美国统计学家。(在新闻)

12
谁是贝叶斯主义者?
随着人们对统计数据产生兴趣,二分法“ Frequentist”与“ Bayesian”很快就变得司空见惯了(谁还没有读过Nate Silver的《信号与噪声》?)。在讲座和入门课程中,观点绝大多数是常客(MLE,值),但往往只花很少的时间来欣赏贝叶斯公式并触及先验分布的想法,通常是切向的。ppp 讨论贝叶斯统计的语气在对概念基础的尊重与对崇高目标之间的鸿沟的怀疑以及暗示对先验分布的选择的任意性或最终使用频数数学之间摇摆不定。 诸如“如果您是贝叶斯人的核心...”之类的句子比比皆是。 问题是,今天的贝叶斯是谁?他们是某些精选的学术机构,您知道如果您去那里会成为贝叶斯主义者?如果是这样,他们是否受到特别追捧?我们仅指的是一些受人尊敬的统计学家和数学家,如果是的话,他们是谁? 它们甚至以纯正的“贝叶斯”形式存在吗?他们会愉快地接受标签吗?它总是一个讨人喜欢的区别吗?他们是在会议上有奇特幻灯片的数学家,没有任何值和置信区间,容易在小册子上发现吗?ppp “贝叶斯”成为一个利基市场?我们是指少数统计学家吗? 还是当前的贝叶斯主义等于机器学习应用程序? ...或者甚至更有可能是,贝叶斯统计不是仅仅是统计的一个分支,而是一种超越了概率计算范围而成为科学哲学的认识论运动吗?在这方面,所有科学家都将是贝叶斯的内心……但是就不会有纯粹的贝叶斯统计学家无法渗透到频繁主义者的技术(或矛盾)中。


6
是否有任何例子表明贝叶斯可信区间明显不如常识性置信区间
最近关于置信度和可信区间之间的差异的问题使我开始重新阅读Edwin Jaynes关于该主题的文章: Jaynes,ET,1976年。《置信区间与贝叶斯区间》,《概率论,统计推论和科学的统计理论基础》,WL Harper和CA Hooker(编),D。Reidel,Dordrecht,第1页。175; (pdf) Jaynes在摘要中写道: ...我们展示了贝叶斯和正统解对涉及置信区间的六个常见统计问题(包括基于相同推理的显着性检验)。在每种情况下,我们都发现情况恰好相反,即贝叶斯方法更易于应用,并且产生相同或更好的结果。实际上,仅当正统结果与贝叶斯结果紧密(或完全一致)时,其结果才令人满意。尚未产生相反的例子。 (强调我的) 该论文于1976年发表,所以也许情况有所发展。我的问题是,是否有一些例子表明,频繁主义者的置信区间明显优于贝叶斯可信区间(根据Jaynes的隐含挑战)? 基于错误的先验假设的示例是不可接受的,因为它们没有说明不同方法的内部一致性。

3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
什么是“非信息先验”?我们可以拥有一个完全没有信息的人吗?
受此问题的评论启发: 我们认为先验中的“非信息性”是什么-所谓的先验信息中仍包含哪些信息? 我通常会在分析中看到先验,在先验分析中,它是尝试从贝叶斯分析中借鉴一些好的部分(可能是一些更容易解释的方式来“做最热的事情”),所以指定的先验是横跨效果测度的界限,集中于0但即使断言均匀分布一个形状与现有-它恰好是平坦的。 使用前是否有更好的信息?
73 bayesian  prior 

14
什么时候(如果有的话)频频论的方法比贝叶斯方法更好?
背景:我没有接受贝叶斯统计方面的正式培训(尽管我对学习更多内容非常感兴趣),但我知道-我想知道的要点是为什么许多人觉得它们似乎比频率统计更可取。甚至我所教授的入门统计学(社会科学)课程中的大学生都发现贝叶斯方法很吸引人-“为什么我们对计算数据的概率感兴趣(给定null呢?)为什么我们不能仅仅量化是零假设还是替代假设?我也读过类似这样的线索,它们也证明了贝叶斯统计的经验优势,但后来我碰到了布拉斯科(Blasco,2001;重点强调): 如果动物育种者对与归纳相关的哲学问题不感兴趣,但对解决问题的工具感兴趣,那么贝叶斯推理派和惯常论推论派都已建立,并且没有必要证明为什么选择另一派或另一派来论证。除了一些复杂的案例外,它们现在都没有操作上的困难... 选择一所学校或另一所学校应与一所学校是否存在另一所学校没有提供的解决方案,解决问题的容易程度有关,以及科学家对特定表达方式的感觉如何。 问题:布拉斯科的名言似乎暗示,有时频频方法实际上比贝叶斯方法更可取。因此,我很好奇:什么时候比贝叶斯方法更偏爱常去方法?我对从概念上(即什么时候知道以原假设为条件的数据的概率特别有用?)和凭经验(即在什么条件下Frequentist方法优于贝叶斯方法?)都可以解决这个问题的答案感兴趣。 如果答案尽可能地易于传达也将是可取的-最好将一些答案反馈给我的班级以与我的学生分享(尽管我知道需要一定程度的技术性)。 最后,尽管经常使用频率统计,但实际上我对贝叶斯全盘获胜的可能性持开放态度。

11
当我的模型错误时,为什么我应该是贝叶斯?
编辑:我添加了一个简单的示例:的均值的推断。我还稍微澄清了为什么不匹配置信区间的可信区间是不好的。XiXiX_i 我是一位虔诚的贝叶斯主义者,正处于某种信仰危机之中。 我的问题如下。假设我要分析一些IID数据。我要做的是:XiXiX_i 首先,提出一个条件模型: p(X|θ)p(X|θ) p(X|\theta) 然后,选择的先验值: θθ\thetap(θ)p(θ) p(\theta) 最后,应用贝叶斯法则,计算后验:(或者应该近似计算,如果它不能计算),并回答我对所有疑问p(θ|X1…Xn)p(θ|X1…Xn)p(\theta | X_1 \dots X_n )θθ\theta 这是一个明智的方法:如果数据的真实模型确实在我的条件的“内部”(它对应于某个值),那么我可以呼吁统计决策理论说我的方法是可以接受的(请参阅Robert's有关详细信息,请参见“贝叶斯选择”;在所有相关章节中,“所有统计信息”也有明确说明。XiXiX_iθ0θ0\theta_0 但是,众所周知,假设我的模型正确无比:为什么自然应该整洁地落入我所考虑的模型的框内?假设对于所有值,数据的实模型与不同,这要现实得多。通常将其称为“错误指定”模型。p (X | θ )θptrue(X)ptrue(X)p_{true}(X)p(X|θ)p(X|θ)p(X|\theta)θθ\theta 我的问题是,在这种更为现实的,错误指定的情况下,与贝叶斯计算(即计算后验分布)相比,对于简单地计算最大似然估计器(MLE),我没有任何好的论据: θ^ML=argmaxθ[p(X1…Xn|θ)]θ^ML=arg⁡maxθ[p(X1…Xn|θ)] \hat \theta_{ML} = \arg \max_\theta [ p(X_1 \dots X_n |\theta) ] 实际上,根据Kleijn,vd Vaart(2012)的说法,在错误指定的情况下,后验分布为: 收敛为到以为中心的狄拉克分布θ中号大号n→∞n→∞n\rightarrow \infty θ^MLθ^ML\hat \theta_{ML} 没有正确的方差(除非两个值恰好相同),以确保后验的可信区间匹配置信区间。(请注意,虽然置信区间显然是贝叶斯人不太在意的事情,但从质量上讲,这意味着后验分布本质上是错误的,因为这意味着其可信区间没有正确的覆盖范围)θθ\theta 因此,我们为没有额外的属性而付出了计算上的额外费用(一般来说,贝叶斯推断要比MLE昂贵) 因此,最后,我的问题是:在模型指定不正确的情况下,是否有关于理论上或经验上的论据,用于对简单的MLE替代方法使用贝叶斯推理? (由于我知道我的问题通常不清楚,如果您不了解某些内容,请告诉我:我会尝试重新表述) 编辑:让我们考虑一个简单的示例:在高斯模型下推断的平均值(已知方差可以进一步简化)。我们考虑高斯先验:我们将表示为先验均值,表示的逆方差。令为的经验均值。最后,请注意:。 σ μ 0 β 0 …

10
贝叶斯与频频主义者的辩论是否有任何数学基础?
它在Wikipedia上说: 数学[概率]在很大程度上与概率的任何解释无关。 问题:那么如果我们想在数学上是正确的,我们是否不应该拒绝对概率的任何解释?即,贝叶斯主义和频繁主义在数学上都是错误的吗? 我不喜欢哲学,但是我喜欢数学,并且我想只在Kolmogorov公理的框架内工作。如果这是我的目标,应该从它说在维基百科上,我应该拒绝遵循双方贝叶斯和frequentism?如果这些概念纯粹是哲学上的而不是数学上的,那么为什么它们首先出现在统计学中? 背景/上下文: 这篇博客文章并没有说同样的话,但是它确实认为,从实用主义的角度来看,将技术归类为“贝叶斯”或“频率论者”是适得其反的。 如果Wikipedia的引用是正确的,那么从哲学的角度来看,试图对统计方法进行分类似乎也适得其反-如果一种方法在数学上是正确的,则当基础数学的假设成立时使用该方法是有效的否则,如果在数学上不正确或假设不成立,则使用它无效。 另一方面,尽管我不太确定为什么,但很多人似乎都用概率论(例如,柯尔莫哥洛夫的公理)来识别“贝叶斯推论”。贾恩斯(Jaynes)关于贝叶斯推理的论着称为“概率”(Probability),以及詹姆斯·斯通(James Stone)的书“贝叶斯规则”(Bayes'Rule)。因此,如果我以表面价值来接受这些主张,那意味着我应该更喜欢贝叶斯主义。 但是,Casella和Berger的书似乎是常客,因为它讨论了最大似然估计量,却忽略了最大后验估计量,但似乎其中的所有内容在数学上都是正确的。 那么,难道不是只能从统计学上说,统计学上唯一正确的版本是对贝叶斯主义和频繁主义完全不知情的统计吗?如果两种分类的方法在数学上都是正确的,那么在某些情况下偏爱某些方法不是不正确的做法,因为这将使模糊,定义不清的哲学优先于精确且定义明确的数学吗? 简介:简而言之,我不了解贝叶斯与常客辩论的数学基础是什么,并且如果没有辩论的数学基础(这是维基百科所声称的),我也不明白为什么在容忍中全部在学术话语中。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.