Questions tagged «bayesian»

贝叶斯推断是一种统计推断的方法,该方法依赖于将模型参数视为随机变量,并应用贝叶斯定理来推导有关参数或假设的主观概率陈述(取决于观察到的数据集)。

7
多少钱?实际问题
这不是家庭作业的问题,而是我们公司面临的实际问题。 最近(两天前),我们向经销商订购了10000个产品标签的制造。经销商是独立的人。他获得了从外部制造的标签,公司付款给经销商。每个标签对公司的成本为1美元。 昨天,经销商附带了标签,但标签捆绑在一起,每包100个标签。这样总共有100个数据包,每个数据包包含100个标签,因此总共有10000个标签。在向经销商支付10000美元之前,我们决定不计几包,以确保每个包中都准确地包含100个标签。当我们计算标签时,我们发现数据包不足100个标签(我们找到了97个标签)。为了确保这不是偶然的,而是有意进行的,我们再计算了5个数据包,并在每个数据包(包括第一个数据包)中找到了以下标签数: Packet Number Number of labels 1 97 2 98 3 96 4 100 5 95 6 97 无法计算每个小包,因此我们决定平均付款。因此,六个封包中的标签平均数量为97.166,因此总付款额为9716美元。 我只想知道统计学家必须如何处理这类问题。 此外,我想知道我们应该支付多少钱才能获得95%的保证,即我们支付的总标签数量不超过实际数量。 附加信息: P(任何大于100个标签的数据包)= 0 P(任何小于90个标签的数据包)= 0 =标签数小于90时很容易检测到小于90个标签,因为数据包的重量更小} 编辑: 经销商只是否认了这种渎职行为。我们发现这些经销商是在特定的佣金下工作的,他们从制造商那里得到公司的付款。当我们直接与制造商联系时,我们发现这既不是制造商也不是经销商的错。制造商说:“标签之所以短缺,是因为纸张的尺寸没有标准化,并且从单张纸上切下的任何数量都将它们捆成一包。” 此外,我们验证了附加信息中给出的第一个断言,因为制造商承认,由于纸张尺寸的小幅增加,因此无法裁切额外的标签,而且由于纸张尺寸的小幅缩小,因此无法裁切100个大小完全相同的标签。

8
有一个很好的,令人信服的示例,其中p值很有用?
标题中的问题是不言而喻的,但我想提供一些背景信息。 ASA在本周早些时候发布了“ 关于p值:上下文,过程和目标 ”的声明,概述了对p值的各种常见误解,并敦促在没有上下文和思想的情况下不要使用它(可以这样说)。任何统计方法,真的)。 为了回应ASA,马特洛夫(Matloff)教授写了一篇博客文章:150年后,ASA对p值表示否。然后,本杰米尼(Benjamini)教授(和我)写了一篇题为“ 这不是p值的过错 –对最近ASA声明的反思”的回复。作为回应,马特洛夫教授在后续帖子中问: 我想看到的是一个很好的,令人信服的示例,其中p值很有用。那确实是底线。 要引用他的两个主要论点反对的用处 -值:ppp 对于大样本,显着性检验是针对原假设的微小,不重要的偏离而发动的。 在现实世界中,几乎没有零假设是真实的,因此对它们进行显着性检验是荒谬而离奇的。 我对其他经过交叉验证的社区成员对这个问题/论点的看法以及对它的良好回应感到非常感兴趣。

9
贝叶斯方法更简单,更实用或更方便的情况列表
贝叶斯主义者和常客之间的统计数据之间存在许多争论。我通常认为这些内容令人反感(尽管我认为它已经消失了)。另一方面,我遇到了几个对这个问题完全务实的人,他们说有时进行频繁分析会更方便,有时进行贝叶斯分析会更容易。我觉得这种观点实用而令人耳目一新。 在我看来,列出此类案件会有所帮助。因为统计分析太多,并且由于我认为通常进行频率分析更为实用(在WinBUGS中编码t检验比在R中执行基于频率的版本所需的单个函数调用要复杂得多。 (例如),最好列出比贝叶斯方法更简单,更实用和/或更方便的贝叶斯方法。 (Two answers that I have no interest in are: 'always', and 'never'. I understand people have strong opinions, but please don't air them here. If this thread becomes a venue for petty squabbling, I will probably delete it. My goal here is to develop a resource that …

8
贝叶斯:似然函数的奴隶?
拉里·瓦瑟曼(Larry Wasserman)教授在他的《所有统计》一书中提出了以下示例(11.10,第188页)。假设我们有一个密度,使得,其中是已知的(负,可积)函数,而归一化常数是未知的。ffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c > 0gggc>0c>0c>0 我们对无法计算情况感兴趣。例如,在非常高维的样本空间上,可能是pdf。c=1/∫g(x)dxc=1/∫g(x)dxc=1/\int g(x)\,dxfff 众所周知,即使未知,也有一些模拟技术可让我们从采样。因此,难题是:我们如何从这样的样本中估算?fffcccccc Wasserman教授描述了以下贝叶斯解决方案:让为先验条件。可能性为 因此,后 不依赖于样本值。因此,贝叶斯不能使用样本中包含的信息来推断。ππ\picccLx(c)=∏i=1nf(xi)=∏i=1n(cg(xi))=cn∏i=1ng(xi)∝cn.Lx(c)=∏i=1nf(xi)=∏i=1n(cg(xi))=cn∏i=1ng(xi)∝cn. L_x(c) = \prod_{i=1}^n f(x_i) = \prod_{i=1}^n \left(c\,g(x_i)\right) = c^n \prod_{i=1}^n g(x_i) \propto c^n \, . X 1,... ,X Ñ Çπ(c∣x)∝cnπ(c)π(c∣x)∝cnπ(c) \pi(c\mid x) \propto c^n \pi(c) x1,…,xnx1,…,xnx_1,\dots,x_nccc 瓦瑟曼教授指出:“贝叶斯是似然函数的奴隶。当似然出错时,贝叶斯推论也将如此”。 我对其他堆垛机的问题是:关于这个特定示例,贝叶斯方法有什么问题(如果有)? PS正如Wasserman教授在回答中所解释的那样,该示例归因于Ed George。

5
杰弗里斯先验为何有用?
我了解在重新参数化下,Jeffreys先验是不变的。但是,我不明白的是为什么需要此属性。 您为什么不希望先验在变量变化下发生变化?
61 bayesian  prior 


2
贝叶斯回归:与标准回归相比,该如何做?
我对贝叶斯回归有一些疑问: 给定标准回归为。如果我想将其更改为贝叶斯回归,我是否需要同时为和(或者这样行不通)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 在标准回归中,将尝试最小化残差以获得和单个值。在贝叶斯回归中如何完成?β0β0\beta_0β1β1\beta_1 我在这里真的很努力: posterior=prior×likelihoodposterior=prior×likelihood \text{posterior} = \text{prior} \times \text{likelihood} 可能性来自当前数据集(所以这是我的回归参数,但不是单个值而是可能性分布,对吗?)。先验来自先前的研究(假设)。所以我得到了这个等式: y=β1x+εy=β1x+ε y = \beta_1 x + \varepsilon 与是我的可能性或后(或者这只是完全错误的)? β1β1\beta_1 我简直不明白标准回归如何转换成贝叶斯回归。

10
谁是常客?
我们已经有一个线程询问谁是贝叶斯主义者,以及一个询问常问者是否是贝叶斯主义者,但是没有线程直接询问谁是贝叶斯主义者?@whuber提出了这个问题,以作为对此线程的注释,并希望得到解答。它们是否存在(是否有任何自我识别的常客)?也许它们只是由贝叶斯主义者组成的,他们在批评主流统计数据时需要替罪羊怪罪? 对已经给出的答案进行元注释:相比之下,贝叶斯统计不仅是根据使用贝叶斯定理(非贝叶斯定理也使用)来定义的,也不是关于对概率的主观解释的(您不会称其为外行)这样说: “我敢打赌,机会小于50:50!”(贝叶斯)-那么我们是否只能根据对概率的解释来定义频繁性?此外,统计学≠≠\ne应用概率,那么对频繁性的定义应仅专注于概率的解释吗?

5
贝叶斯和惯常主义方法给出不同答案的示例
注:我是知道的哲学贝叶斯和频率统计之间的差异。 例如,“在桌上的硬币正面朝上的概率是多少”在常客统计中是没有意义的,因为它已经落在正面或反面了,没有任何概率。因此,该问题没有常人性的答案。 但是,这种差异显然不是我要问的那种差异。 相反,我想知道他们的预测是如何形成良好的问题实际上是不同在现实世界中,不包括任何理论/哲学分歧,如我上面提到的例子。 换句话说: 这是一个例子的问题,该问题在常客和贝叶斯统计中都可以回答,两者的答案不同? (例如,也许其中一个回答“ 1/2”,而另一个回答“ 2/3”。) 有这样的区别吗? 如果是这样,有哪些例子? 如果没有,那么什么时候解决特定问题时使用贝叶斯统计或常客统计实际上有什么不同? 我为什么要避免一个偏向另一个?



6
贝叶斯统计教程
我正在尝试加快贝叶斯统计的速度。我有一些统计背景(STAT 101),但不是太多-我想我可以理解事前,事后和可能性:D。 我现在还不想读贝叶斯教科书。我希望从能够使我快速成长的资源(首选网站)中读取内容。像这样的东西,但是有更多细节。 有什么建议吗?

2
为什么不允许贝叶斯算法查看残差?
在文章“讨论:生态学家应该成为贝叶斯主义者?”中 当布莱恩·丹尼斯(Brian Dennis)的目的似乎是警告人们时,他给出了令人惊讶的平衡和积极的贝叶斯统计观点。但是,他在一段中没有任何引用或理由的情况下说: 您会看到,贝叶斯不允许查看其残差。通过模型下的极端程度来判断结果违反了似然原理。对于贝叶斯来说,没有坏的模型,只有坏的信念。 为什么不允许贝叶斯分析残差?对此适当的引用是什么(即他在引用谁)? Dennis,B. 讨论:生态学家应该成为贝叶斯主义者吗? 生态应用,美国生态学会,1996年,6,1095-1103

2
协方差矩阵的逆对数据说什么?(直觉上)
我对的性质感到好奇。任何人都可以说出一些直觉的信息“对数据有何看法?”Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} 编辑: 感谢您的回复 在学习了一些很棒的课程之后,我想补充一点: 它是信息的度量,即是沿方向的信息量。xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx 对偶性:由于是正定的,也是正定的,因此它们是点积范数,更确切地说,它们是彼此的偶范数,因此我们可以针对正则化最小二乘问题导出Fenchel对偶,并最大化wrt对偶问题。我们可以根据它们的条件选择它们之一。ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1} 希尔伯特空间:和列(和行)跨越相同的空间。因此,使用或表示之间没有任何优势(当这些矩阵之一处于不适状态时)Σ−1Σ−1\Sigma^{-1}ΣΣ\SigmaΣ−1Σ−1\Sigma^{-1}ΣΣ\Sigma 贝叶斯统计:范数在贝叶斯统计中起重要作用。也就是说,它确定了我们之前有多少信息,例如,当先验密度的协方差像 我们将获得非信息性信息(或者可能是Jeffreys先前的信息)Σ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 惯常统计:使用Cramér-Rao界线,它与Fisher信息密切相关。实际上,费舍尔信息矩阵(对数似然梯度自身的外积)是Cramér–Rao约束的,即Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}(正半定锥,即浓度)椭圆形)。因此,当Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F},最大似然估计器是有效的,即,数据中存在最大信息,因此频频机制是最佳的。用简单的话来说,对于某些似然函数(请注意,似然函数的形式完全取决于可能生成数据的概率模型,即生成模型),最大似然是有效且一致的估计器,其规则类似于老板。(对不起,杀了它)

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.