Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。

3
如何用时变偏差建模偏差硬币?
偏向硬币模型通常具有一个参数。从一系列平局中估计一种方法是使用Beta先验并以二项式似然计算后验分布。θθ=P(Head|θ)θ=P(Head|θ)\theta = P(\text{Head} | \theta)θθ\theta 在我的环境中,由于一些奇怪的物理过程,我的硬币特性正在缓慢变化,成为时间的函数。我的数据是一组有序抽奖,即。我可以认为我在离散且规则的时间网格上每仅获得一个抽奖。吨{ ħ ,Ť ,ħ ,ħ ,ħ ,Ť ,。。。} tθθ\thetattt{H,T,H,H,H,T,...}{H,T,H,H,H,T,...}\{H,T,H,H,H,T,...\}ttt 您将如何建模?我正在考虑类似卡尔曼滤波器的事情,以适应隐藏变量为并保持二项式可能性的事实。我可以使用什么来建模P(\ theta(t + 1)| \ theta(t))以保持推理的可操纵性?P (θ (吨+ 1 )| θ (吨))θθ\thetaP(θ(t+1)|θ(t))P(θ(t+1)|θ(t))P(\theta(t+1)|\theta(t)) 编辑以下答案(谢谢!):我想将\ theta(t)建模θ(t)θ(t)\theta(t)为1级马尔可夫链,就像在HMM或Kalman滤波器中所做的那样。我可以做出的唯一假设是θ(t)θ(t)\theta(t)是平滑的。我可以将P(θ(t+1)|θ(t))=θ(t)+ϵP(θ(t+1)|θ(t))=θ(t)+ϵP(\theta(t+1)|\theta(t)) = \theta(t) + \epsilon与\ epsilon一起写成ϵϵ\epsilon一个小高斯噪声(卡尔曼滤波器的思想),但这会破坏\ theta的要求θθ\theta必须保留在[0,1][0,1][0,1]。遵循@J Dav的想法,我可以使用probit函数将实线映射到[0,1][0,1][0,1],但是我有直觉,这将提供非分析性的解决方案。均值\ theta(t)的 beta分布θ(t)θ(t)\theta(t) 而更大的差异可以解决问题。 我问这个问题是因为我觉得这个问题是如此简单,以至于必须先进行研究。

3
推销先验……用钱!
假设我有 “专家”,我想从中得出一些变量的先验分布。我想用真钱激励他们。这个想法是要得出先验,观察随机变量实现,然后根据他们的先验与证据的匹配程度在专家之间划分一些预定的“钱包”。在最后一部分中,将先验和证据映射到支付向量上有什么建议的方法?X Ñ XķķkXXXññnXXX
10 bayesian  prior 

1
那么,如何将贝叶斯估计包括在荟萃分析中呢?
受此问题启发,尤其是“问题3”: 除非提供频度高的参数化描述,否则后验分布很难纳入荟萃分析。 最近,我一直在考虑将荟萃分析合并到贝叶斯模型中(主要是作为先验信息的来源),但是如何朝另一个方向发展呢?如果贝叶斯分析确实确实变得更流行,并且变得非常容易合并到现有代码中(想到SAS 9.2及更高版本中的BAYES语句),我们应该更频繁地从文献中获得贝叶斯效应的估计。 让我们假设一下,有一位应用研究人员决定进行贝叶斯分析。使用与我在该问题上使用的相同的模拟代码,如果它们与常客框架一起使用,则会得到以下常客估计: log relative risk = 1.1009, standard error = 0.0319, log 95% CI = 1.0384, 1.1633 使用标准的,全缺省且无信息的先验BAYES语句分析,没有理由存在良好的对称置信区间或标准误差。在这种情况下,后验很容易用正态分布来描述,因此人们可以这样描述并“足够接近”,但是如果有人报告贝叶斯效应估计和不对称可信区间会怎样?是否有一种简单的方法可以将其包括在标准的荟萃分析中,还是需要将估计值塞入尽可能接近的参数化分布中?或者是其他东西?

2
一本既讲理论又讲数学的好书
在我的学年和大学期间,我有足够的统计学课程。我对概念有一定的了解,例如CI,p值,解释统计显着性,多重检验,相关性,简单线性回归(最小二乘法)(通用线性模型)以及所有假设检验。在早期的大部分时间里,我大多是在数学上被介绍给我的。最近,我相信,借助于《直觉生物统计学》一书,我已经掌握了对实际概念理论的前所未有的理解。 现在,我发现我缺乏对拟合模型(估计模型的参数)等的理解。特别是,诸如最大似然估计,广义线性模型,贝叶斯推断统计方法之类的概念对我而言似乎总是陌生的。没有足够的示例或教程或概念上合理的示例,就像人们在简单的概率模型或互联网上的其他(基本)主题中发现的那样。 我是一名生物信息学家,我从事RNA-Seq数据的研究,该数据处理原始读取计数,以便查找基因表达(或差异基因表达)。从我的背景来看,即使我不熟悉统计模型,我也能够掌握泊松分布假设和负二项式等的原因。但是有些论文涉及广义线性模型和估计MLE等。我相信我有必要了解的背景。 我想我要的是你们中的一些专家认为有用的方法,这是一本书,可以帮助我以更直观的方式掌握这些概念(不仅是严格的数学,而且有数学支持的理论)。由于我将主要应用它们,因此(目前)我对了解什么是满意的,以后,我可以返回严格的数学证明...有人有什么建议吗?如果我要求的主题确实分散在一本书中,则我不介意购买多于一本书。 非常感谢你!

2
我可以测试先前给定数据的有效性吗?
问题 我正在编写一个R函数,该函数执行贝叶斯分析以在已知先验和数据的情况下估计后验密度。我希望该功能在用户需要重新考虑之前发出警告。 在这个问题上,我有兴趣学习如何评估先验。先前的问题涵盖了陈述知情先验的机制(此处和此处)。 在以下情况下,可能需要重新评估先验值: 数据代表了一个极端的情况,在陈述之前 数据中的错误(例如,如果先验单位为kg,则数据单位为g) 由于代码中的错误,因此从一组可用的优先级中选择了错误的优先级 在第一种情况下,先验通常仍然足够分散,除非数据值在不受支持的范围内(例如,logN或Gamma <0),否则数据通常会使它们不堪重负。其他情况是错误或错误。 问题 关于使用数据评估先验的有效性是否存在任何问题? 是否有任何特定测试最适合此问题? 例子 这是两个与较差的数据集,因为它们来自具有(红色)或(蓝色)的。升Ò 克ñ(0 ,1 )升ØGñ(0,1个)logN(0,1)ñ(0 ,5 )ñ(0,5)N(0,5)ñ( 8 ,0.5 )ñ(8,0.5)N(8,0.5) 蓝色数据可能是有效的先验+数据组合,而红色数据将需要先验分布,该分布支持负值。 set.seed(1) x<- seq(0.01,15,by=0.1) plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='') points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red') points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')

4
开始进行统计建模的提示和技巧?
我从事数据挖掘领域的工作,很少接受统计学方面的正规教育。最近,我读了很多关于贝叶斯学习和挖掘范式的工作,我觉得这很有趣。 我的问题是(分为几个部分),考虑到一个问题,是否有一个通用的框架可以用来构建统计模型?给定想要为其基础流程建模的数据集时,您要做的第一件事是什么?有没有好的书籍/教程可以解释这个过程,或者是经验的问题?在构建模型时,推理是在您的思维的最前沿吗?还是在担心如何使用数据进行计算之前首先要描述数据? 任何见识将不胜感激!谢谢。

1
为什么贝叶斯统计成为越来越流行的研究主题?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 去年关闭。 浏览美国新闻统计前100名计划的研究领域,在贝叶斯统计中几乎所有人都很沉重。但是,如果我去低年级学校,他们中的大多数人仍在进行古典/频率统计研究。例如,我目前的学校(在QS世界统计排名中介于150到200之间,因此不被认为是一流学校),只有一位教授关注贝叶斯统计,而对贝叶斯统计几乎感到不满。我采访过的一些研究生甚至说,贝叶斯统计学家正在做贝叶斯统计,因此我当然强烈反对。 但是,我想知道为什么会这样。我有一些有根据的猜测: (a)古典/常用统计的方法学上没有足够的进步空间,古典/常用统计的唯一可行的研究是应用,这将是低年级学校的主要重点,因为顶级学校应该更多倾向于理论和方法研究。 (b)它在很大程度上取决于领域。统计的某些分支仅更适合于贝叶斯统计,例如许多统计方法的科学应用,而其他分支更适合于经典统计(例如金融领域)。(如果我错了,请纠正我)鉴于此,在我看来,顶级学校有很多统计系在科学领域进行申请,而较低级的学校统计系则主要将重点放在财务领域,因为这可以帮助他们创收。和资金。 (c)频繁使用方法存在巨大的问题无法解决,例如容易发生MLE的过度拟合等问题。贝叶斯方法似乎提供了一个出色的解决方案。 (d)计算能力在这里,因此贝叶斯计算不再像30年前那样成为瓶颈。 (e)这可能是我最自以为是的猜测。古典/频率主义统计学家有一个抵制之处,就是他们不喜欢可能会取代古典统计角色的新方法论。但是就像拉里·瓦瑟曼(Larry Wasserman)所说的那样,这取决于我们正在尝试做的事情,每个人都应该保持开放的态度,尤其是作为研究人员。

1
高斯过程/狄利克雷过程等随机过程是否具有密度?如果没有,如何对他们应用贝叶斯规则?
Dirichlet Pocess和高斯过程通常被称为“函数分布”或“分布分布”。在那种情况下,我可以有意义地谈谈GP下函数的密度吗?也就是说,高斯过程或Dirichlet过程是否具有概率密度的概念? 如果不是,那么,如果对函数的先验概率的概念没有很好地定义,我们如何使用贝叶斯定律从后验先到?贝叶斯非参数世界中是否存在诸如MAP或EAP估计之类的东西?非常感谢。

5
条件概率-它们是贝叶斯主义独有的吗?
我想知道条件概率是贝叶斯主义所独有的,还是更多地是统计学家/统计学家/概率论者之间在几种思想流派中所共有的一般概念。 我以为是这样,因为我假设没有人可以是逻辑上的,所以我认为常客主义者至少在理论上会同意,同时警告不要使用贝叶斯主义推断更多是出于实际原因,而不是由于条件概率。p(A,B)=p(A|B)p(B)p(A,B)=p(A|B)p(B)p(A,B) = p(A|B)p(B)

3
当输入条件独立时,超平面可以对数据进行最佳分类-为什么?
在名为“ 深度学习和信息瓶颈原理”的论文中,作者在II A)节中指出: 单神经元只能对线性可分离的输入进行分类,因为它们只能在其输入空间实现超平面。当输入是独立的时,超平面可以对数据进行最佳分类。u=wh+bu=wh+bu = wh+b 为了说明这一点,他们得出以下结论。使用贝叶斯定理,他们得到: (1)p(y|x)=11+exp(−logp(x|y)p(x|y′)−logp(y)p(y′))p(y|x)=11+exp(−logp(x|y)p(x|y′)−logp(y)p(y′))p(y|x) = \frac{1}{1 + exp(-log\frac{p(x|y)}{p(x|y')} -log\frac{p(y)}{p(y')})} 其中是输入,y是类别,y '是预测类别(我假设,y '未定义)。继续,他们说:xxxyyyy′y′y'y′y′y' (2)p(x|y)p(x|y′)=∏Nj=1[p(xj|y)p(xj|y′)]np(xj)p(x|y)p(x|y′)=∏j=1N[p(xj|y)p(xj|y′)]np(xj)\frac{p(x|y)}{p(x|y')} = \prod^N_{j=1}[\frac{p(x_j|y)}{p(x_j|y')}]^{np(x_j)} 其中是输入维度,n不确定(同样,两者均未定义)。考虑一个S型神经元,S型激活函数σ (u )= 1NNNnnn和预激活u,将(2)插入(1)后,我们得到最佳权重值wj=logp(xj|y)σ(u)=11+exp(−u)σ(u)=11+exp(−u)\sigma(u) = \frac{1}{1+exp(-u)}uuu和b=logp(y)wj=logp(xj|y)p(xj|y′)wj=logp(xj|y)p(xj|y′)w_j = log\frac{p(x_j|y)}{p(x_j|y')},当输入值ħĴ=Ñp(XĴ)。b=logp(y)p(y′)b=logp(y)p(y′)b=log\frac{p(y)}{p(y')}hj=np(xj)hj=np(xj)h_j=np(x_j) 现在我的问题。我知道将(2)插入(1)会导致最佳权重和输入值。我不明白的是以下内容:w,b,hw,b,hw,b,h (1)如何使用贝叶斯定理导出? (2)如何得出?什么是?它是什么意思?我认为这与条件独立性有关nnn 即使x的尺寸是有条件独立的,如何能说出x等于其缩放的概率?(即如何陈述?)hj=np(xj)hj=np(xj)h_j=np(x_j) 编辑:变量是一个二进制类变量。据此,我认为y '是“其他”类。这将解决问题1.您是否同意?yyyy′y′y'

1
ARIMA vs Kalman过滤器-它们如何相关
当我开始阅读有关卡尔曼滤波器的文章时,它认为这是ARIMA模型的一种特例(即ARIMA(0,1,1))。但实际上似乎情况更加复杂。首先,ARIMA可用于预测,而卡尔曼滤波器可用于滤波。但是它们不是紧密相关吗? 问题: ARIMA和卡尔曼滤波器之间是什么关系?一个正在使用另一个吗?是另一种特例吗?

1
杰弗里斯(Jeffreys)先验二项式可能性
如果我将Jeffreys先验用于二项式概率参数则这意味着使用分布。θθ\thetaθ∼beta(1/2,1/2)θ∼beta(1/2,1/2)\theta \sim beta(1/2,1/2) 如果我转换为参考的新帧,则显然也不会以分布的形式分布。ϕ=θ2ϕ=θ2\phi = \theta^2ϕϕ\phibeta(1/2,1/2)beta(1/2,1/2)beta(1/2,1/2) 我的问题是,从什么意义上说,杰弗里斯对重新参数化的先验不变性是什么?我想我对这个话题真是个误解。 最好, 本


2
在贝叶斯线性回归中评估后验预测分布
我很困惑,如何评价贝叶斯线性回归后的预测分布,过去的基本情况进行了说明这里第3页,以下复制。 p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde y \mid \beta, \sigma^2) p(\beta, \sigma^2 \mid y) 基本情况是此线性回归模型: ÿ= Xβ+ ϵ ,ÿ∼N(Xβ,σ2)y=Xβ+ϵ,y∼N(Xβ,σ2) y = X \beta + \epsilon, \hspace{10mm} y \sim N(X \beta, \sigma^2) 如果我们使用一个统一的现有上,带刻度-INV χ 2上之前σ 2,OR正常-逆伽马之前(见此处)的后验预测分布解析和是学生吨。 ββ\betaχ2χ2\chi^2σ2σ2\sigma^2 这个模型呢? ÿ= Xβ+ ϵ ,ÿ〜ñ(Xβ,Σ )ÿ=Xβ+ϵ,ÿ〜ñ(Xβ,Σ) y = X \beta + …

1
贝叶斯A / B测试的公式没有任何意义
我正在使用贝叶斯ab测试的公式,以便使用贝叶斯方法计算AB测试的结果。 PR (p乙> p一个)= ∑我= 0α乙− 1B (α一个+ 我,β乙+ β一个)(β乙+ i )B(1 + i ,β乙)B (α一个,β一个)镨(p乙>p一个)=∑一世=0α乙-1个乙(α一个+一世,β乙+β一个)(β乙+一世)乙(1个+一世,β乙)乙(α一个,β一个) \Pr(p_B > p_A) = \sum^{\alpha_B-1}_{i=0} \frac{B(\alpha_A+i,\beta_B+\beta_A)}{(\beta_B+i)B(1+i,\beta_B)B(\alpha_A, \beta_A)} 哪里 α一个α一个\alpha_A加A的成功次数 β一个β一个\beta_A加A的失败次数 α乙α乙\alpha_B加上B的成功次数 β乙β乙\beta_B加上B的失败次数 乙乙B是Beta函数 示例数据: control: 1000 trials with 78 successes test: 1000 trials with 100 successes 标准的非贝叶斯prop测试可以给我带来显着的结果(p <10%): prop.test(n=c(1000,1000), x=c(100,78), correct=F) # 2-sample test …
10 r  bayesian  ab-test 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.