Questions tagged «confidence-interval»

置信区间是一个以置信度覆盖未知参数的区间。置信区间是一个经常性的概念。它们经常与可靠的时间间隔混淆,后者是贝叶斯模型。 (1α)%

2
如果“标准误差”和“置信区间”衡量的是测量精度,那么精度的测量是什么?
在第40页的“傻瓜生物统计学”一书中,我读到: 标准误差(缩写为SE)是表明您对某物的估计或测量的精确度的一种方法。 和 置信区间提供了另一种方法来指示某事物的估计或度量的精度。 但是,没有任何关于如何指示测量精度的文章。 问题:如何指示某物的测量精度如何?有哪些方法? 不要与测试的准确性和准确性相混淆:https : //en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification


3
关于何时使用
我指的是这个视频讲座,用于计算置信区间。但是,我有些困惑。这个家伙正在使用 -statistics进行计算。但是,我认为应该是统计量。我们没有给出总体的真实标准差。我们正在使用样本标准差来估计真实值。zzzttt 那么,为什么他对置信区间而不是对采用正态分布呢?ttt

4
回归参数的置信区间:贝叶斯与经典
给定两个长度均为n的数组x和y,我拟合了模型y = a + b * x,并希望计算斜率的95%置信区间。这是(b-delta,b + delta),其中b是通常找到的, delta = qt(0.975,df=n-2)*se.slope se.slope是斜率的标准误差。从R获得斜率标准误差的一种方法是summary(lm(y~x))$coef[2,2]。 现在,假设我写出给定x和y的斜率的可能性,将其乘以“平坦”的先验,然后使用MCMC技术从后验分布中得出样本m。限定 lims = quantile(m,c(0.025,0.975)) 我的问题:(lims[[2]]-lims[[1]])/2大约等于上面定义的增量吗? 附录下面是一个简单的JAGS模型,这两个模型似乎有所不同。 model { for (i in 1:N) { y[i] ~ dnorm(mu[i], tau) mu[i] <- a + b * x[i] } a ~ dnorm(0, .00001) b ~ dnorm(0, .00001) tau <- pow(sigma, -2) …


3
置信区间何时“有意义”,而相应的可信区间却没有?
通常情况下,具有95%覆盖率的置信区间与包含95%后验密度的可信区间非常相似。当先验是均匀的或在后者情况下接近均匀时,会发生这种情况。因此,置信区间通常可以用来近似可信区间,反之亦然。重要的是,我们可以由此得出结论,对于许多简单的用例而言,将置信区间作为可信区间的误解很多,几乎没有实际意义。 有许多没有发生这种情况的例子,但是它们似乎都被贝叶斯统计的拥护者挑剔,试图证明这种惯常方法是有问题的。在这些示例中,我们看到置信区间包含不可能的值等,这应该表明它们是无稽之谈。 我不想回顾那些例子,也不想对贝叶斯与频频主义者进行哲学讨论。 我只是在寻找相反的例子。在任何情况下,置信度和可信度间隔都大不相同,并且置信度过程提供的间隔明显更好吗? 需要说明的是:这是通常期望可信区间与相应的置信区间重合的情况,即使用先验,统一等先验时的情况。我对有人选择事先任意决定的情况不感兴趣。 编辑: 为响应@JaeHyeok Shin的以下回答,我必须不同意他的示例使用正确的可能性。我使用近似贝叶斯计算来估计下面R中theta的正确后验分布: ### Methods ### # Packages require(HDInterval) # Define the likelihood like <- function(k = 1.2, theta = 0, n_print = 1e5){ x = NULL rule = FALSE while(!rule){ x = c(x, rnorm(1, theta, 1)) n = length(x) x_bar = mean(x) rule = …

5
效果大小真的优于p值吗?
在应用研究中,很多重点放在依赖和报告效应大小上,而不是p值上(例如,下面进一步引用)。 但是,不是像p值一样,效应大小是随机变量,并且在重复相同实验时,样本之间的影响大小可能会有所不同吗?换句话说,我在问什么统计特征(例如,效应大小在样本之间的可变性小于p值)使效应大小比p值更好的证据衡量指标? 但是,我应该提到一个重要的事实,它将p值与效果大小区分开。也就是说,效果大小之所以可以估算,是因为它具有总体参数,而p值却没有任何估算,因为它没有任何总体参数。 对我而言,效应大小只是在某些研究领域(例如,人类研究)有助于将来自各种研究人员开发的测量工具的经验发现转化为通用度量的度量(可以说,使用人类研究可以更好地适应这种度量)量化研究俱乐部)。 也许如果我们将一个简单的比例作为效应大小,那么以下(R中的)是什么表明效应大小超过p值的优势?(p值会发生变化,但效果大小不会改变) binom.test(55, 100, .5) ## p-value = 0.3682 ## proportion of success 55% binom.test(550, 1000, .5) ## p-value = 0.001731 ## proportion of success 55% 请注意,大多数效果大小与测试统计量线性相关。因此,使用效应量进行零假设检验很容易。 例如,事前设计产生的统计量可以很容易地转换为相应的科恩效应大小。这样,Cohen d的分布只是at分布的比例定位版本。 引号: 由于p值是混杂指标,因此理论上100个样本大小不同且影响大小不同100项的研究可能具有相同的单个p值,而100个具有相同单一影响值的研究可能各自具有100个不同的p值。 要么 p值是随样本不同而变化的随机变量。。。。因此,比较两个不同实验的p值,或对同一实验中测量的两个变量的测试的p值进行比较,并声明一个比另一个重要,是不合适的。 引文: 汤普森(2006)。行为统计的基础:一种基于洞察力的方法。纽约,纽约:吉尔福德出版社。 Good,PI和Hardin,JW(2003)。统计中的常见错误(以及如何避免)。纽约:威利。

2
错误规范下的统计推断
统计推断的经典处理方法基于这样的假设,即使用了正确指定的统计数据。也就是说,生成观测数据的分布是统计模型: 但是,在大多数情况下,我们不能假设这是真的。我想知道,如果我们放弃正确指定的假设,统计推断程序会发生什么。P∗(Y)P∗(Y)\mathbb{P}^*(Y)yyyMM\mathcal{M}P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} 我发现怀特1982年在误配下对ML估计进行了一些研究。有人认为最大似然估计量是的一致估计量 可使统计模型内所有分布和真实分布\ mathbb {P} ^ *中的KL散度最小。Pθ1=argminPθ∈MKL(P∗,Pθ)Pθ1=arg⁡minPθ∈MKL(P∗,Pθ)\mathbb{P}_{\theta_1}=\arg \min_{\mathbb{P}_\theta \in \mathcal{M}} KL(\mathbb{P}^*,\mathbb{P}_\theta)P∗P∗\mathbb{P}^* 置信度估计量会怎样?让我们概述置信度估计量。令 δ:ΩY→2Θδ:ΩY→2Θ\delta:\Omega_Y \rightarrow 2^\Theta为集合估计量,其中ΩYΩY\Omega_Y是样本空间,2Θ2Θ2^\Theta是在参数空间\ Theta上设置的功效ΘΘ\Theta。我们想知道的是\ delta产生的集合δδ\delta包含真实分布P∗P∗\mathbb{P}^*,即P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.\mathbb{P}^*(\mathbb{P}^* \in \{P_\theta : \theta \in \delta(Y)\}):=A. 但是,我们当然不知道真实的分布P∗P∗\mathbb{P}^*。正确指定的假设告诉我们P∗∈MP∗∈M\mathbb{P}^* \in \mathcal{M}。但是,我们仍然不知道模型是哪种分布。但是,infθ∈ΘPθ(θ∈δ(Y)):=Binfθ∈ΘPθ(θ∈δ(Y)):=B\inf_{\theta \in \Theta} \mathbb{P}_\theta(\theta \in \delta(Y)):=B是概率A的下限AAA。公式BBB是置信度集合估计器的置信度水平的经典定义。 如果我们放弃正确指定的假设,那么不一定是的下界,是我们实际上感兴趣的术语。确实,如果我们假设模型指定不正确(在大多数现实情况下都是如此),则为0,因为统计模型不包含真实分布。A A P * MBBBAAAAAAP∗P∗P^*MM\mathcal{M} 从另一个角度来看,当模型指定不正确时,人们可能会想到与什么相关。这是一个更具体的问题。如果模型指定不正确,是否仍然具有含义。如果没有,为什么我们还要打扰参数统计呢?乙BBBBBB 我猜怀特1982年在这些问题上有一些结果。不幸的是,由于缺乏数学背景,我无法理解那里写的很多东西。

4
样本量很大时的置信区间
我的问题可以改写为“如何使用大数据评估抽样误差”,特别是对于期刊出版物。这是说明挑战的示例。 通过一个非常大的数据集(来自100多家医院的100000例独特患者及其处方药),我有兴趣估算服用特定药物的患者比例。得到这个比例很简单。它的置信区间(例如,参数或自举)非常紧密/狭窄,因为n非常大。尽管样本量很大很幸运,但我仍在寻找一种方法来评估,呈现和/或可视化某些形式的错误概率。尽管置入/可视化置信区间似乎无益(如果没有误导)(例如95%CI:.65878-.65881),但似乎也无法避免一些不确定性陈述。 请让我知道你的想法。我将不胜感激有关该主题的任何文献。即使样本量很大也可以避免对数据过度自信的方法。

1
QQ线的置信带
这个问题不是专门针对 R,但我选择用R它来说明。 考虑一下围绕(正常)qq线产生置信带的代码: library(car) library(MASS) b0<-lm(deaths~.,data=road) qqPlot(b0$resid,pch=16,line="robust") 我正在寻找一种解释(或替代性的解释为纸/在线文档的链接)这些置信带的构造方式(我已经在R的帮助文件中看到了对Fox 2002的引用,但可惜我没有这个方便的书)。 我的问题将通过一个例子更加精确。这是R计算这些特定CI的方式(我已经缩短/简化了中使用的代码car::qqPlot) x<-b0$resid good<-!is.na(x) ord<-order(x[good]) ord.x<-x[good][ord] n<-length(ord.x) P<-ppoints(n) z<-qnorm(P) plot(z,ord.x,type="n") coef<-coef(rlm(ord.x~z)) a<-coef[1] b<-coef[2] abline(a,b,col="red",lwd=2) conf<-0.95 zz<-qnorm(1-(1-conf)/2) SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) #[WHY?] fit.value<-a+b*z upper<-fit.value+zz*SE lower<-fit.value-zz*SE lines(z,upper,lty=2,lwd=2,col="red") lines(z,lower,lty=2,lwd=2,col="red") 问题是:用于计算这些SE的公式的合理性是什么(例如line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n))。 FWIW该公式与线性回归中常用的置信带公式非常不同

4
从贝叶斯概率角度来看,为什么95%的置信区间不包含具有95%概率的真实参数?
从Wikipedia页面上的置信区间: ...如果在重复(可能不同)实验的许多单独数据分析中构建置信区间,则包含参数真实值的此类区间的比例将与置信度匹配... 并在同一页面上: 置信区间不能预测给定实际获得的数据,参数的真实值具有置信区间内的特定概率。 如果我理解正确的话,那么最后的陈述是考虑到概率论的频繁性解释。但是,从贝叶斯概率角度来看,为什么95%的置信区间不包含具有95%概率的真实参数?如果不是,则以下推理出了什么问题? 如果我知道某个过程在95%的时间内都能给出正确的答案,则下一个答案正确的可能性为0.95(假设我没有有关该过程的任何额外信息)。同样,如果有人向我展示了由某个过程创建的置信区间,该过程将在95%的时间内包含真实参数,那么根据我所知,我是否应该说它包含0.95概率的真实参数? 这个问题类似于但不相同,为什么95%CI并不意味着95%的机会包含均值?这个问题的答案一直集中在为什么从经常性的角度来看,95%CI并不意味着95%的机会包含均值。我的问题是相同的,但是从贝叶斯概率角度来看。

3
GAM模型的置信区间
阅读 mgcv::gam的帮助页面: 使用拟合模型预测的任何数量的置信度/可信区间都可轻松获得 但是我想不出一种方法来真正得到一个。我以为predict.gam会有一个type=confidence和level参数,但没有。您能帮助我如何创建它吗?

1
如何计算持续期间的预测误差(置信区间)?
我经常需要通过每月的数据系列来预测未来的时期。 可以使用公式来计算时间序列中下一个时段在alpha处的置信区间,但这永远不会包括如何处理第二个时段和第三个时段等。 我可以从视觉上想象,如果任何预测都用上下置信区间作图,那么通常这些区间应相对于平均预测成指数地增加或减少,因为不确定性是一种累积力。 假设我有4月= 5月10日= 6月8日= 7月11日= 13的单位销售,没有其他背景,例如季节性或人口数据 我们需要预测(尽管盲目地)八月,九月,十月。 您将使用哪种方法?更重要的是,您将如何衡量9月和10月的信心? 抱歉,对于某些专家来说,这可能是一个简单的问题-我一直在努力寻找一个明确的答案,而且我敢肯定,这是像我这样的所有业余爱好者都希望理解的事情。

2
来自混合效应模型的预测值周围的置信区间是什么意思?
我在看这个页面并注意到R中lme和lmer的置信区间方法。对于不了解R的人,这些是生成混合效果或多级模型的函数。如果我在重复测量设计等方面具有固定效果,那么围绕预测值(类似于均值)的置信区间意味着什么?我可以理解,对于一个效果,您可以有一个合理的置信区间,但是在我看来,在这样的设计中,围绕预期均值的置信区间似乎是不可能的。承认随机变量会导致估计中的不确定性这一事实可能很大,但在那种情况下,从推断的意义上比较各个值根本毫无用处。要么, 我是否在这里遗漏了一些东西,或者我对情况的分析是正确的?... [并且可能是为什么没有在lmer中实现(但很容易在SAS中实现)的理由。:)]

1
二项式随机变量的预测区间
二项式随机变量的预测间隔的公式(近似或精确)是什么? 假设ÿ〜乙我Ñ ø 米(Ñ ,p )Y∼Binom(n,p)Y \sim \mathsf{Binom}(n, p),和我们观察ÿyy(从绘制ÿYY)。该ñnn是已知的。 我们的目标是从获得新抽签的95%预测间隔ÿYY。 点估计是ñ p^np^n\hat{p},其中p = ÿp^= yñp^=yn\hat{p}=\frac{y}{n}。对于A置信区间 p是直截了当的,但我不能找到针对预测时间间隔的公式ÿ。如果我们知道p(而不是 p ),那么95%的预测区间只是涉及寻找一个二项式的位数。有什么明显的我可以忽略的吗?p^p^\hat{p}ÿYYpppp^p^\hat{p}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.