Questions tagged «confidence-interval»

置信区间是一个以置信度覆盖未知参数的区间。置信区间是一个经常性的概念。它们经常与可靠的时间间隔混淆,后者是贝叶斯模型。 (1α)%

14
对解释置信区间进行澄清?
我现在的想法“与置信水平置信区间的理解 ”是,如果我们试图计算置信区间多次(用新鲜的样本,每次),它将包含正确的参数的时间。1 - α1−α1−α1 - \alpha1−α1−α1 - \alpha 尽管我意识到这与“真正参数位于此区间的概率”不同,但我还是要澄清一些事情。 [主要更新] 在我们计算95%的置信区间之前,我们有95%的概率计算出的区间将覆盖真实参数。在计算出置信区间并获得特定区间,我们就不能再说了。我们甚至无法做出某种非经常性的论据,因为我们95%确信真正的参数将位于;因为如果可以的话,它将与诸如此类的反例相矛盾:确切地说,置信区间是多少?[ a ,b ][a,b][a,b][a,b][a,b][a,b][a,b] 我不想就概率论进行辩论;取而代之的是,我正在寻找一种精确的数学解释,说明特定间隔变化方式和原因,以及为什么不改变(或不改变)我们看到该间隔之前有95%的概率。如果您辩称“在看到间隔之后,概率的概念就不再有意义了”,那就好了,让我们对它确实有意义的概率进行解释。[a,b][a,b][a,b] 更确切地说: 假设我们对计算机进行编程以计算95%的置信区间。计算机进行一些数字运算,计算间隔,直到我输入密码后才拒绝显示间隔。在我输入密码并看到间隔之前(但是在计算机已经计算出间隔之后),间隔包含真实参数的概率是多少?这是95%,这部分不值得辩论:这是我对这个特定问题感兴趣的概率的解释(我意识到我正在压制主要的哲学问题,这是有意为之)。 但是,只要我输入密码并让计算机向我显示它计算的间隔,该概率(间隔包含真实参数)就可能改变。任何声称这种可能性永远不会改变的说法将与上述反例相抵触。在此反例中,概率可以从50%变为100%,但是... 是否有任何示例将概率更改为100%或0%以外的值(编辑:如果是,则是什么)? 有没有发现特定间隔之后概率不变的示例(即,真实参数位于的概率仍然是95%)?[ a ,b ][a,b][a,b][a,b][a,b][a,b][a,b] 看到计算机吐出之后,概率一般如何(以及为什么)改变?[a,b][a,b][a,b] [编辑] 感谢您提供的所有出色答案和有用的讨论!

4
为什么统计学家说不重要的结果意味着“您不能拒绝零”而不是接受零假设?
像两个样本t检验一样,传统的统计检验集中在试图消除以下假设:两个独立样本的函数之间没有差异。然后,我们选择一个置信度,并说如果均值差超过95%,我们可以拒绝原假设。如果不是,我们“不能拒绝原假设”。这似乎意味着我们也不能接受它。这是否意味着我们不确定原假设是否成立? 现在,我想设计一个假设是两个样本的函数相同的检验(这与假设两个样本不同的传统统计检验相反)。因此,我的原假设是两个样本不同。我应该如何设计这样的测试?简单地说,如果p值小于5%,我们可以接受没有显着差异的假设吗?

2
贝努利抽样的置信区间
我有一个伯努利随机变量的随机样本,其中是iidrv,,而是未知参数。X1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp 显然,一个可以找到的估计:。pppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N 我的问题是如何建立的置信区间?ppp


3
从引导式重采样中获得的置信区间是什么意思?
我一直在这个站点上查看有关自举和置信区间的许多问题,但我仍然感到困惑。我感到困惑的部分原因可能是我的统计学知识不够先进,无法理解很多答案。我正在学习统计学入门课程,但是我的数学水平仅是中代数II,因此超出该水平的任何内容都会使我感到困惑。如果该站点上的一位知识渊博的人可以在我一级上解释此问题,那将非常有帮助。 我们在课堂上学习如何使用bootstrap方法进行重采样,并使用它们为我们要测量的某些统计数据建立置信区间。因此,举例来说,假设我们从大量人口中抽样,发现40%的人表示将投票给候选人A。我们假设此样本是对原始人口的准确反映,在这种情况下,我们可以从发现有关人口的信息。因此,我们进行了重新抽样,发现(使用95%的置信度)所得的置信区间为35%至45%。 我的问题是,这个置信区间实际上是什么意思? 我一直在读,(频率)置信区间和(贝叶斯)可信区间是有区别的。如果我理解正确,可信区间将表示在我们的情况下,真实参数有95%的机会在给定区间内(35%-45%),而置信区间将表示在此区间中有95%情况类型(但不一定是我们的情况),我们使用的方法将准确地报告true参数在给定间隔内。 假设这个定义是正确的,我的问题是:使用引导程序方法建立的置信区间时,我们所说的“真实参数”是什么?我们是指(a)原始种群的真实参数,还是(b)样本的真实参数?如果是(a),那么我们可以说95%的时间引导方法将准确报告有关原始人口的真实陈述。但是我们怎么可能知道呢?整个引导程序方法不是基于这样的假设吗原始样本是否准确反映了其来源?如果是(b),那么我完全不了解置信区间的含义。我们是否不知道样本的真实参数?这是一个简单的测量! 我与老师讨论了这个问题,她很有帮助。但是我还是很困惑。

6
可信区域和贝叶斯假设检验之间有什么联系?
在常客统计中,置信区间和检验之间存在紧密的联系。使用推理约在分布作为一个例子,将置信区间 包含在重要性级别上未被检验拒绝的所有值。Ñ (μ ,σ 2)1 - α ˉ X ± 吨α / 2(Ñ - 1 )⋅ 小号/ √μμ\muN(μ,σ2)N(μ,σ2)\rm N(\mu,\sigma^2)1−α1−α1-\alpha μ吨αx¯±tα/2(n−1)⋅s/n−−√x¯±tα/2(n−1)⋅s/n\bar{x}\pm t_{\alpha/2}(n-1)\cdot s/\sqrt{n}μμ\mutttαα\alpha 从这个意义上讲,频繁的置信区间是倒置测试。(顺便说一句,这意味着我们可以将值解释为的最小值,为此参数的空值将包含在置信区间中。我发现这可能是一种有用的方法,向了解一些统计信息的人解释真正含义。)α 1 - α ppppαα\alpha1−α1−α1-\alphappp 在阅读了贝叶斯可信区域的决策理论基础后,我开始怀疑可信区域与贝叶斯测试之间是否存在类似的联系/对等关系。 有一般的联系吗? 如果没有常规连接,是否存在连接的示例? 如果没有一般的联系,我们怎么看?

2
通过效果包对lmer对象的置信区间的可信度如何?
Effects包提供了一种非常快速和方便的方式来绘制通过lme4包获得的线性混合效应模型结果。该effect函数可以非常快速地计算置信区间(CI),但是这些置信区间的可信度如何? 例如: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- lmer(strength ~ batch + (1 | cask), Pastes) effs <- as.data.frame(effect(c("batch"), fm1)) ggplot(effs, aes(x = batch, y = fit, ymin = lower, ymax = upper)) + geom_rect(xmax = Inf, xmin = -Inf, ymin = effs[effs$batch == "A", "lower"], ymax = effs[effs$batch == …


3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
了解线性回归的形状和置信带的计算
我试图了解与OLS线性回归相关联的置信带的曲线形状的起源,以及它与回归参数(斜率和截距)的置信区间之间的关系,例如(使用R): require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) 似乎该频带与使用2.5%截距和97.5%斜率以及97.5%截距和2.5%斜率计算的线的极限有关(尽管不完全相同): xnew <- seq(0,400) int <- confint(fit) lines(xnew, (int[1,2]+int[2,1]*xnew)) lines(xnew, (int[1,1]+int[2,2]*xnew)) 我不明白的是两件事: 2.5%斜率和2.5%截距以及97.5%斜率和97.5%截距的组合怎么样?这些给出的线显然在上面绘制的带之外。也许我不了解置信区间的含义,但是如果在95%的情况下,我的估计值都在置信区间内,那么这似乎是可能的结果? 是什么决定上限和下限之间的最小距离(即,接近在上方添加的两条线相交的点)? 我猜这两个问题都会出现,因为我不知道/不了解这些频段的实际计算方式。 如何使用回归参数的置信区间来计算上限和下限(不依赖predict()或类似函数,即手动)?我试图破译R中的prepare.lm函数,但是编码超出了我的范围。对于任何适合统计初学者的相关文献或解释,我将不胜感激。 谢谢。


2
如何找到评级的置信区间?
埃文·米勒(Evan Miller)的“ 如何不按平均评分进行排序 ”建议使用置信区间的下限来获得被评分项目的合计“分数”。但是,它使用的是伯努利模型:评级是竖起大拇指或竖起大拇指。 什么是使用其指定的离散分数的评级模型合理的置信区间至恒星,假设一个项目的评分数量可能会少吗?111kkk 我想我可以看到如何调整Wilson和Agresti-Coull区间的中心 p~=∑ni=1xi+z2α/2p0n+z2α/2p~=∑i=1nxi+zα/22p0n+zα/22\tilde{p} = \frac{\sum_{i=1}^n{x_i} + z_{\alpha/2}^2\; p_0}{n + z_{\alpha/2}^2} 其中或(可能更好)是所有项目的平均评分。但是,我不确定如何调整间隔的宽度。我(经修订)的最佳猜测是p0=k+12p0=k+12p_0 = \frac{k+1}{2} p~±zα/2n~∑ni=1(xi−p~)2+zα/2(p0−p~)2n~−−−−−−−−−−−−−−−−−−−−−−−−−√p~±zα/2n~∑i=1n(xi−p~)2+zα/2(p0−p~)2n~\tilde{p} \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\frac{\sum_{i=1}^n{(x_i - \tilde{p})^2} + z_{\alpha/2}(p_0-\tilde{p})^2}{\tilde{n}}} 与,但我不能仅仅挥舞它作为Agresti-Coull的类比来证明其合理性,n~=n+z2α/2n~=n+zα/22\tilde{n} = n + z_{\alpha/2}^2 Estimate(X¯)±zα/2n~Estimate(Var(X))−−−−−−−−−−−−−−−√Estimate(X¯)±zα/2n~Estimate(Var(X))\text{Estimate}(\bar{X}) \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\text{Estimate}(\text{Var}(X))} 是否有适用的标准置信区间?(请注意,我没有订阅任何期刊,也不能轻松访问大学图书馆;请务必提供适当的参考文献,但请补充实际结果!)


1
计算联合置信区间的高斯相关不等式的结果
根据《 Quanta杂志》上一篇非常有趣的文章:“长期寻找,发现并几乎丢失” –已经证明,给定向量具有多元变量高斯分布,给定间隔围绕的相应分量的,然后I 1,… ,I n xx=(x1,…,xn)x=(x1,…,xn)\mathbf{x}=(x_1,\dots,x_n)I1,…,InI1,…,InI_1,\dots,I_n xx\mathbf{x} p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) (高斯相关不等式或GCI;有关更一般的表述,请参见https://arxiv.org/pdf/1512.08776.pdf)。 这看起来确实很简单,并且文章说这对联合置信区间有影响。但是,这对我而言似乎毫无用处。假设我们正在估计参数 ,并且发现了估计器都是(也许是渐近的)联合正态的(例如MLE估计器) 。然后,如果我为每个参数计算95%的置信区间,则GCI保证超立方体I_1 \ times \ dots I_n是一个联合置信区域,其覆盖范围不小于(0.95)^ n ...甚至覆盖率也非常低中度n。θ1,…,θnθ1,…,θn\theta_1,\dots,\theta_nθ1^,…,θn^θ1^,…,θn^\hat{\theta_1},\dots,\hat{\theta_n}I1×…InI1×…InI_1\times\dots I_n(0.95)n(0.95)n(0.95)^n nnn 因此,找到联合置信区域似乎不是一个明智的方法:如果知道协方差矩阵并且该协方差矩阵更锐利,则很难找到多元高斯的通常置信区域,即超椭球。当协方差矩阵未知时,找到置信区域可能有用吗?您能给我展示一个GCI与联合置信区域计算的相关性的例子吗?

5
置信区间说明精度(如果有的话)是什么?
Morey等人(2015年)认为,置信区间具有误导性,并且与理解它们有关。其中,他们将精度谬误描述如下: 精度谬误 置信区间的宽度表示我们对参数知识的精度。狭窄的置信区间显示精确的知识,而宽的置信误差则显示不精确的知识。 估计的精度和置信区间的大小之间没有必要的联系。看到这种情况的一种方法是,想象两个研究人员(一名高级研究员和一名博士生)正在分析实验中参与者的数据。为了使博士生受益,这项高级研究人员决定将参与者随机分为两组,每组25人,这样他们就可以分别分析一半的数据集。在随后的会议上,有一个两股另一个自己学生的牛逼置信区间的平均值。博士生的95 % CI为52 ± 2,而高级研究员的95 % CI为52 ± 2。505050252525Ťtt95 %95%95\%52 ± 252±252 \pm 295 %95%95\%CI为。53±453±453 \pm 4 资深研究员指出,他们的结果大致上是一致的,他们可以使用各自两个点估计值的均等加权平均值作为真实平均值的总体估计。52.552.552.5 但是,这名博士生认为,这两种方法的权重不应平均分配:她指出自己的CI的宽度是后者的一半,并且认为自己的估算更为准确,因此应加权更大。她的顾问指出,这是不正确的,因为对两种方法进行加权加权后得出的估算值将不同于对整个数据集进行分析得出的估算值,该估算值必须为。博士生的错误是假设CI直接表示数据后精度。52.552.552.5 上面的示例似乎具有误导性。如果我们将一个样本随机分为两半,那么我们期望样本均值和标准误都接近。在这种情况下,使用加权平均值(例如,通过反误差加权)与使用简单算术平均值之间应该没有任何区别。但是,如果估计值不同并且其中一个样本的误差明显更大,则可能表明此类样本存在“问题”。 显然,在上面的示例中,样本大小相同,因此通过均值的平均值“合并”数据与整个样本的均值相同。问题在于,整个示例遵循的逻辑不明确,即首先将样本分为几部分,然后再重新合并以进行最终估计。 该示例可以重新措辞以得出完全相反的结论: 研究人员和学生决定将其数据集分为两半,并进行独立分析。之后,他们比较了自己的估计,似乎样本意味着他们计算出的差异很大,而且学生的估计的标准误也更大。该学生担心这可能会暗示其估计精度存在问题,但是研究人员暗示,置信区间和精度之间没有联系,因此这两个估计值都是可信赖的,并且可以发布其中的任何一个(随机选择),作为他们的最终估计。 ttt x¯±c×SE(x)x¯±c×SE(x) \bar x \pm c \times \mathrm{SE}(x) ccc 所以我的问题是: 精确谬论真的是谬论吗?置信区间对精度有何评价? Morey,R.,Hoekstra,R.,Rouder,J.,Lee,M.和Wagenmakers,E.-J. (2015)。将置信度置入置信区间的谬误。心理公告与评论,1-21。https://learnbayes.org/papers/confidenceIntervalsFallacy/

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.