Questions tagged «confidence-interval»

置信区间是一个以置信度覆盖未知参数的区间。置信区间是一个经常性的概念。它们经常与可靠的时间间隔混淆,后者是贝叶斯模型。 (1α)%

2
对数转换后计算标准误差
考虑一个正态分布的随机数字集: x <- rnorm(n=1000, mean=10) 我们想知道平均值和平均值的标准误差,因此我们执行以下操作: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units 大! 但是,假设我们不一定知道我们的原始分布服从正态分布。我们对数据进行对数转换,并执行相同的标准误差计算。 z <- log(x, base=10) mean(z) # something near 1 log units se(z) # something near 0.001 log units 太酷了,但是现在我们需要进行逆变换才能以非日志单位显示我们的答案。 10^mean(z) # something near 10.0 …

3
如何计算对数正态数据集平均值的置信区间?
我在很多地方都听说过/可以通过获取每个样本的对数来将数据集转换为正态分布的东西,计算转换后的数据的置信区间,并使用逆运算将其转换回(例如,将分别提高10到下限和上限的幂)。log10log10\log_{10} 但是,我对此方法有点怀疑,仅仅是因为它不适用于平均值:10mean(log10(X))≠mean(X)10mean⁡(log10⁡(X))≠mean⁡(X)10^{\operatorname{mean}(\log_{10}(X))} \ne \operatorname{mean}(X) 正确的方法是什么?如果它对均值本身不起作用,那么如何在均值的置信区间内起作用?


4
如何计算均值的置信区间?
想象一下,您重复了三次实验。在每个实验中,您收集三次重复的测量值。与三种实验方法之间的差异相比,一式三份趋于相当接近。计算总和非常容易。但是,如何计算总体均值的置信区间呢? 样本数据: 实验1:34、41、39 实验2:45、51、52 实验3:29、31、35 假设实验中的重复值与每个实验的平均值都遵循高斯分布。实验中变化的SD小于实验方法中的SD。还假设每个实验中这三个值没有顺序。每行中三个值的从左到右顺序完全是任意的。 一种简单的方法是先计算每个实验的平均值:38.0、49.3和31.7,然后计算这三个值的平均值及其95%置信区间。使用此方法,总体平均值为39.7,95%置信区间为17.4至61.9。 这种方法的问题在于它完全忽略了三份重复之间的差异。我想知道是否没有一个很好的方法来说明这种差异。

3
轮廓似然与置信区间之间的关系是什么?
为了制作这张图表,我从均值= 0和sd = 1的正态分布中生成了大小不同的随机样本。然后使用t.test()函数使用从0.001到.999(红线)范围内的alpha截止值来计算置信区间,并使用下面的代码在线下计算代码的轮廓似然性(我可以暂时找不到链接:编辑:找到它),这由蓝线表示。绿线表示使用R density()函数的归一化密度,数据由每个图表底部的方框图显示。右边是95%置信区间(红色)和最大似然区间的1/20(蓝色)的毛毛虫图。 用于轮廓可能性的R代码: #mn=mean(dat) muVals <- seq(low,high, length = 1000) likVals <- sapply(muVals, function(mu){ (sum((dat - mu)^2) / sum((dat - mn)^2)) ^ (-n/2) } ) 我的具体问题是,这两种类型的间隔之间是否存在已知关系,为什么除了n = 3以外,所有情况下的置信区间似乎都比较保守。还需要有关我的计算是否有效(以及一种更好的方法)以及这两种类型的区间之间的一般关系的评论/答案。 R代码: samp.size=c(3,4,5,10,20,1000) cnt2<-1 ints=matrix(nrow=length(samp.size),ncol=4) layout(matrix(c(1,2,7,3,4,7,5,6,7),nrow=3,ncol=3, byrow=T)) par(mar=c(5.1,4.1,4.1,4.1)) for(j in samp.size){ #set.seed(200) dat<-rnorm(j,0,1) vals<-seq(.001,.999, by=.001) cis<-matrix(nrow=length(vals),ncol=3) cnt<-1 for(ci in vals){ …

5
为什么我们不利用t分布来构造比例的置信区间?
要计算具有未知总体标准偏差(sd)的均值的置信区间(CI),我们采用t分布估算总体标准差。值得注意的是,CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}其中。但是因为我们没有总体标准偏差的点估计,所以我们通过近似进行估计,其中σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 相反,对于人口比例,要计算CI,我们近似为其中提供和CI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 我的问题是,为什么我们对人口比例的标准分布感到自满?

1
线性回归系数的置信区间应基于正态分布还是
让我们有一些线性模型,例如简单的方差分析: # data generation set.seed(1.234) Ng <- c(41, 37, 42) data <- rnorm(sum(Ng), mean = rep(c(-1, 0, 1), Ng), sd = 1) fact <- as.factor(rep(LETTERS[1:3], Ng)) m1 = lm(data ~ 0 + fact) summary(m1) 结果如下: Call: lm(formula = data ~ 0 + fact) Residuals: Min 1Q Median 3Q Max -2.30047 …

4
狭窄的置信区间-更高的准确性?
关于置信区间,我有两个问题: 显然,狭窄的置信区间意味着在该区间内获得观测值的机会较小,因此,我们的准确性更高。 同样,95%置信区间比99%置信区间更窄。 99%置信区间比95%更准确。 有人可以给出一个简单的解释,以帮助我理解准确度和狭窄度之间的区别吗?

3
当样本较大时,为什么不使用T分布来估计均值?
基础统计课程通常建议在样本大小n大(通常超过30或50)时使用正态分布来估计总体参数的平均值。学生的T分布用于较小的样本量,以说明样本标准偏差的不确定性。当样本量较大时,样本标准偏差可提供有关总体标准偏差的良好信息,从而可以进行正态分布估计。我明白了。 但是,当您可以准确地获得您的置信区间时,为什么要使用估计呢?无论样本大小如何,如果仅使用T分布可以准确估计出正态分布,那么使用正态分布有什么意义呢?

1
基于自举的置信区间
在研究基于引导的置信区间时,我曾经阅读以下语句: 如果引导程序分布向右偏斜,则基于引导程序的置信区间会进行校正,以将端点进一步移至右侧;这似乎违反直觉,但这是正确的操作。 我正在尝试理解上述陈述的逻辑基础。

4
结合两个置信区间/点估计
假设其中有两个来自相同总体的独立样本,并且对这两个样本使用了不同的方法来得出点估计和置信区间。在平凡的情况下,明智的人只会合并两个样本并使用一种方法进行分析,但是现在让我们假设由于样本之一的局限性(例如缺少数据)而不得不使用不同的方法。这两个单独的分析将为感兴趣的人口属性生成独立的,同样有效的估计。凭直觉,我认为应该有一种方法可以在点估计和置信区间方面适当地组合这两个估计,从而产生更好的估计程序。我的问题是最好的方法是什么?我可以想象根据每个样本中的信息/样本大小进行某种加权平均,但是置信区间又如何呢?

2
为什么要使用“随机”置信度或可信区间?
我最近正在阅读一篇论文,该论文将随机性纳入其置信度和可信区间中,我想知道这是否是标准的(如果是标准的话,为什么这样做是合理的)。为了设置符号,假设我们的数据是并且我们有兴趣为参数创建间隔。我习惯于通过构建函数来构建置信度/可信度区间:θ ∈ ΘX ∈ XX∈Xx \in Xθ ∈ Θθ∈Θ\theta \in \Theta FX:Θ →交通{ 0 ,1 }FX:Θ→{0,1个}f_{x} : \Theta \rightarrow \{0,1\} 并让我们的间隔为。一世= { θ ∈ Θ:FX(θ )= 1 }一世={θ∈Θ:FX(θ)=1个}I = \{ \theta \in \Theta \, : \, f_{x}(\theta) = 1\} 从某种意义上说,这是随机的,它取决于数据,但条件是它只是一个间隔。相反,本文定义 GX:Θ →交通[ 0 ,1 ]GX:Θ→[0,1个]g_{x} : \Theta \rightarrow [0,1] 以及上的iid统一随机变量的集合。它定义关联的间隔为。请注意,除了数据之外,这很大程度上取决于辅助随机性。 …

2
置信区间的解释
注意:如果这是重复的事,请提前致歉,我在搜索中没有找到类似的q 假设我们有一个真实的参数p。置信区间C(X)是RV,包含95%的时间。现在假设我们观察X并计算C(X)。常见的答案似乎是将其解释为“有95%的机会包含p”是不正确的,因为它“要么包含p,要么不包含p”。 但是,比方说,我从一个洗过的纸牌的顶部挑选一张卡片,并将其面朝下。凭直觉,我认为这张卡成为黑桃王牌的概率为1/52,即使实际上“不是黑桃王牌”。为什么我不能将这种推理应用于置信区间示例? 或者,如果说卡的“概率”是黑桃的王牌是没有意义的,因为它是“是或不是”,那么我仍然会以51:1的概率说它不是黑桃的王牌。还有另一句话来描述此信息吗?这个概念与“概率”有何不同? 编辑:从贝叶斯概率的解释中,也许更清楚一点,如果我被告知随机变量包含p的95%的时间,那么给定该随机变量的实现(并且没有其他要限制的信息)是正确地说随机变量有95%的概率包含p? 编辑:同样,从概率论的概率解释来看,假设频率论者同意不说“置信区间包含p的概率为95%”之类的话。对于常客来说,拥有置信区间包含p的“置信度”是否仍然合乎逻辑? 令alpha为显着性水平,令t = 100-alpha。K(t)是置信区间包含p的常客的“置信度”。K(t)应该在t中增加是有道理的。当t = 100%时,常客应该确定(根据定义)置信区间包含p,因此我们可以归一化K(1)=1。类似地,K(0)=0。大概K(0.95)在0和1,并且K(0.999999)更大。频率论者会认为K与P(概率分布)不同吗?

1
lmer模型使用哪种多重比较方法:lsmeans或glht?
我正在使用具有一个固定效果(条件)和两个随机效果(由于主题设计和配对而导致的参与者)的混合效果模型分析数据集。该模型是使用lme4包生成的exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 接下来,我针对没有固定效果(条件)的模型对该模型进行了似然比检验,结果有显着差异。我的数据集中有3个条件,因此我想进行多重比较,但不确定使用哪种方法。我在CrossValidated和其他论坛上发现了许多类似的问题,但我仍然很困惑。 据我所见,人们建议使用 1.该lsmeans包- lsmeans(exp.model,pairwise~condition)这给了我下面的输出: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

5
对于平均置信区间的近似误差时
令是一族iid随机变量,其值在,具有均值和方差{Xi}ni=1{Xi}i=1n\{X_i\}_{i=1}^n[0,1][0,1][0,1]μμ\muσ2σ2\sigma^2。给出均值的简单置信区间,只要知道就 使用σσ\sigmaP(| X¯−μ|>ε)≤σ2nε2≤1nε2(1).P(|X¯−μ|>ε)≤σ2nε2≤1nε2(1). P( | \bar X - \mu| > \varepsilon) \le \frac{\sigma^2}{n\varepsilon^2} \le\frac{1}{n \varepsilon^2} \qquad (1). 同样,由于渐近分布为标准正态随机变量,因此有时使用正态分布来“构造”近似置信区间。X¯−μσ/n√X¯−μσ/n\frac{\bar X- \mu}{\sigma/\sqrt{n}} 在多项选择题答案统计考试中,我不得不使用这种近似代替(1)(1)(1)每当时。我一直对此感到非常不舒服(超出您的想象),因为无法量化近似误差。n≥30n≥30n \geq 30 为什么使用法线逼近而不是?(1)(1)(1) 我不想再盲目地应用规则。是否有好的参考文献可以支持我拒绝这样做并提供适当的替代方法?((1)是我认为合适的替代方法的示例。)n≥30n≥30n \geq 30(1)(1)(1) 在这里,虽然σσ\sigma和E[|X|3]E[|X|3]E[ |X|^3]未知,但它们很容易被限制。 请注意,我的问题是一个参考请求,尤其是有关置信区间的请求,因此与此处建议作为部分重复的问题的区别有所不同和此处。那里没有答案。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.