Questions tagged «confidence-interval»

置信区间是一个以置信度覆盖未知参数的区间。置信区间是一个经常性的概念。它们经常与可靠的时间间隔混淆,后者是贝叶斯模型。 (1α)%

2
卡方的置信区间
我正在尝试找到一种解决方案,以比较两个“拟合优度卡方”检验。更准确地说,我想比较两个独立实验的结果。在这些实验中,作者使用拟合优度卡方比较随机猜测(预期频率)与观测频率。两次实验的参与者人数相同,实验步骤相同,只是刺激改变了。这两个实验结果表明存在显着的卡方(实验1:X 2(18)= 45; p <.0005;实验2:X 2(18)= 79; p <.0001)。 现在,我要做的就是测试这两个结果之间是否存在差异。我认为解决方案可能是使用置信区间,但是我不知道如何仅根据这些结果来计算这些置信区间。或者也许是一个比较效果大小的测试(科恩的w)? 有人有解决办法吗? 非常感谢! FD

2
如何在PLS中计算回归系数的置信区间?
PLS的基本模型是,给定的矩阵和向量y与 X = TP'+ E,y = T q'+ f相关, 其中T是一个潜在的n x k矩阵,而E ,f是噪声项(假设X,y为中心)。n×mn×mn \times mXXXnnnyyyX=TP′+E,X=TP′+E,X = T P' + E, y=Tq′+f,y=Tq′+f,y = T q' + f,TTTn×kn×kn \times kE,fE,fE, fX,yX,yX, y PLS生成T,P,q的估计T,P,qT,P,qT, P, q,以及回归系数\ hat {\ beta}的“捷径”向量,β^β^\hat{\beta}从而y∼Xβ^y∼Xβ^y \sim X \hat{\beta}。我想在一些简化的假设下找到\ hat {\ beta}的分布β^β^\hat{\beta},其中可能包括以下内容: 该模型是正确的,即 对于未知的T,P,q,X = TP'+ E,y = T q'+ …

2
从分层数据中获取并解释自举的置信区间
我对获得数量X的自举置信区间很感兴趣,因为该数量在10个人中各有10次测量。 一种方法是获取每个人的均值,然后重新引导均值(例如,用替换对均值进行重新采样)。 另一种方法是在自举过程的每次迭代中执行以下操作:在每个个体内,用替换对那个个体的10个观察值重新采样,然后为那个个体计算一个新的均值,最后计算一个新的组均值。在这种方法中,原始数据集中观察到的每个个体在引导程序的每次迭代中总是对组均值有所贡献。 最后,第三种方法是将上述两种方法结合起来:对个体进行重新采样,然后在这些个体内进行重新采样。此方法与先前的方法不同之处在于,它允许同一个人在每次迭代中对组均值贡献乘数,尽管由于每个贡献都是通过独立的重采样过程生成的,所以这些贡献可能会彼此略有不同。 在实践中,我发现这些方法对置信区间的估计不同(例如,使用一个数据集,我发现第三种方法的置信区间要比前两种方法大得多),所以我很好奇每种方法可能是什么解释代表。

1
如何计算非线性方程的95%置信区间?
我有一个方程式可以根据海牛的年龄(以天为单位(以葡萄牙语为单位))预测海牛的体重: R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias)) 我已经使用nls()在R中对其进行了建模,并得到了以下图形: 现在,我要计算95%的置信区间并将其绘制在图形中。我对每个变量a,b和c使用了上限和下限,如下所示: lower a = a - 1.96*(standard error of a) higher a = a + 1.96*(standard error of a) (the same for b and c) 然后我使用较低的a,b,c绘制较低的线,并使用较高的a,b,c绘制较高的线。但是我不确定这是否是正确的方法。它给我这张图: 这是这样做的方法,还是我做错了?

3
计算“实际覆盖概率”是否与计算“可信区间”相同?
我正在阅读入门级统计教科书。在关于二项式分布数据中成功比例的最大似然估计一章中,它给出了计算置信区间的公式,然后毫无保留地提及 考虑其实际覆盖率,即该方法产生捕获真实参数值的间隔的概率。这可能比标称值小很多。 并建议构建一个替代的“置信区间”,该区间可能包含实际的覆盖概率。 我第一次遇到标称覆盖率和实际覆盖率的想法。通过这里的旧问题,我想我已经理解了:有两个不同的概念,我们称为概率,第一个是尚未发生的事件将产生给定结果的可能性,第二个是观察者对已经发生的事件的结果的猜测是多么真实。似乎置信区间只测量第一种类型的概率,而所谓的“可信区间”则测量第二种类型的概率。我概括地说,置信区间是计算“名义覆盖率”的区间,可信区间是覆盖“实际覆盖率”的区间。 但是也许我对这本书有误解(尚不清楚它提供的不同计算方法是针对置信区间和可信区间,还是针对两种不同类型的置信区间),或者我曾经使用过其他资料我目前的理解。特别是我对另一个问题的评论, 置信区间为常客,贝叶斯可信 我怀疑我的结论,因为这本书没有在该章中描述贝叶斯方法。 因此,请澄清我的理解是正确的,还是我在途中犯了逻辑错误。

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
使用交叉验证时计算预测间隔
是否通过以下方式计算标准差估算值: sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√.sN=1N∑i=1N(xi−x¯)2. s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}. (http://en.wikipedia.org/wiki/Standard_deviation#Sample_standard_deviation) 从10倍交叉验证中抽取的预测准确性?我担心由于训练集之间的实质重叠(尽管预测集是独立的),因此每次折叠之间计算的预测准确性是相互依赖的。任何讨论此问题的资源都将非常有帮助。

2
2.04标准错误的含义?当置信区间广泛重叠时,均值的显着不同吗?
下面的图片是从这篇文章中心理科学。一位同事指出了两个不寻常的事情: 根据标题,误差线显示为“±2.04标准误差,置信区间为95%”。我只见过±1.96 SE用于95%CI,而我找不到关于2.04 SE用于任何目的的任何信息。2.04 SE是否具有一些公认的含义? 案文指出,按计划进行的成对比较发现,平均惊吓幅度在误差与正确的可预测试验(t(30)= 2.51,p <.01)和误差与正确的不可预测试验(t(30)= 2.61,p <.01)(综合F检验在p <.05时也很显着)。但是,该图显示了所有三个条件的误差线基本重叠。如果±2.04 SE间隔重叠,那么在p <.05时,这些值有何显着不同?重叠部分足够大,我假设±1.96 SE间隔也重叠。

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
回归均值差的置信区间
假设我有一个二次回归模型 ,且误差满足通常的假设(独立,正常,独立于值)。令为最小二乘估计。Y=β0+β1X+β2X2+ϵY=β0+β1X+β2X2+ϵ Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon ϵϵ\epsilonXXXb0,b1,b2b0,b1,b2b_0, b_1, b_2 我有两个新的值和,我有兴趣获得的置信区间。XXXx1x1x_1x2x2x_2v=E(Y|X=x2)−E(Y|X=x1)=β1(x2−x1)+β2(x22−x21)v=E(Y|X=x2)−E(Y|X=x1)=β1(x2−x1)+β2(x22−x12)v = E(Y|X = x_2) - E(Y|X=x_1) = \beta_1 (x_2 - x_1) + \beta_2 (x_2^2 - x_1^2) 点估计为,并且(如果我错了,请纠正我)我可以通过估计方差使用软件提供的系数的方差和协方差估计。v^=b1(x2−x1)+b2(x22−x21)v^=b1(x2−x1)+b2(x22−x12)\hat{v} = b_1 (x_2 - x_1) + b_2 (x_2^2 - x_1^2)s^2=(x2−x1)2Var(b1)+(x22−x21)2Var(b2)+2(x2−x1)(x2−x21)Cov(b1,b2)s^2=(x2−x1)2Var(b1)+(x22−x12)2Var(b2)+2(x2−x1)(x2−x12)Cov(b1,b2)\hat{s}^2 = (x_2 - x_1)^2 \text{Var}(b_1) + …

2
我们能否拒绝通过抽样产生置信区间的零假设而不是零假设?
我被教导,我们可以从总体中采样后以置信区间的形式生成参数估计。例如,在没有违背假设的情况下,95%的置信区间应具有95%的成功率,其中包含我们估计的总体中真实参数是什么。 即 从样本产生点估计。 产生一个范围内的值,理论上有95%的机会包含我们尝试估计的真实值。 但是,当主题变为假设检验时,步骤描述如下: 假设某个参数为原假设。 给定该原假设,则得出获得各种点估计值的可能性的概率分布。 如果原假设为真,则如果我们得到的点估计的产生时间少于5%,则拒绝原假设。 我的问题是这样的: 为了拒绝零值,是否有必要使用零值假设来产生我们的置信区间?为什么不只是执行第一个过程并获得我们对真实参数的估计(在计算置信区间时未明确使用我们的假设值),然后拒绝零假设(如果它不在此区间内)? 从逻辑上讲,从直觉上看,这在逻辑上等效于我,但是我担心我错过了一些非常基本的东西,因为可能有这样一种教导。

2
如果我希望有95%的机会出现少于1%的对象有故障,我需要多少个样本?
我需要确保我的XML网站地图的垃圾少于(链接断开)。URL的列表是成百上千的,即使出于所有原因我也可能不愿意一一测试所有URL,但我还是不愿意这样做:1%1%1\% 1 - Saved bandwidth 2 - Faster traffic for real clients 3 - Less noise in visitor statistics (because my test would count as a visit) 5 - I could go on... 所以我认为随机取一个子集就足够了,问题是我不知道概率。 我可以使用一个简单的功能吗? 如果有帮助的话,我们可以假设有一个先验信息,可了解链路在运行过程中断裂的可能性。假设在每次运行中,给定链接的断开为。0.75%0.75%0.75\%

1
为什么多项式回归中的贝叶斯可信区间偏向而置信区间正确?
考虑下面的绘图,在该绘图中,我模拟了以下数据。我们看一下二元结果,用黑线表示真实概率为1。协变量x和p (y o b s = 1 | x )之间的函数关系是具有逻辑链接的三阶多项式(因此在双向过程中是非线性的)。yobsyobsy_{obs}xxxp(yobs=1|x)p(yobs=1|x)p(y_{obs}=1 | x) 绿线是GLM logistic回归拟合,其中被引入为三阶多项式。虚线绿线是围绕预测的95%置信区间p (Ý ø b 小号 = 1 | X ,β),其中β拟合回归系数。我曾经和这个。xxxp(yobs=1|x,β^)p(yobs=1|x,β^)p(y_{obs}=1 | x, \hat{\beta})β^β^\hat{\beta}R glmpredict.glm 类似地,pruple线与95%可信区间的平均后的使用均匀现有贝叶斯逻辑回归模型的。为此,我使用了具有功能的软件包(设置提供了统一的先验信息)。p(yobs=1|x,β)p(yobs=1|x,β)p(y_{obs}=1 | x, \beta)MCMCpackMCMClogitB0=0 红点表示数据集中的观测值,黑点表示y o b s = 0的观测值。请注意,在分类/离散分析中常见的是y,但没有观察到p (y o b s = 1 | x )。yobs=1yobs=1y_{obs}=1yobs=0yobs=0y_{obs}=0yyyp(yobs=1|x)p(yobs=1|x)p(y_{obs}=1 | x) 可以看到几件事: 我故意模拟了左手稀疏。我希望由于缺乏信息(观察)而在这里扩大信心和可信区间。xxx …

1
二项式条件下未来成功比例的预测间隔
假设我拟合了二项式回归并获得了点估计和回归系数的方差-协方差矩阵。这样一来,我就可以为将来的实验的预期成功比例获得CI ,但是我需要为观察到的比例获得CI。已经发布了一些相关的答案,包括模拟(假设我不想这样做)和指向Krishnamoorthya等人的链接(并不能完全回答我的问题)。ppp 我的推理如下:如果仅使用二项式模型,则不得不假定是从正态分布中采样的(具有相应的Wald CI),因此不可能以封闭形式获得观察比例的CI。如果我们假设p是从beta分布中采样的,那么事情就容易多了,因为成功次数将遵循Beta-Binomial分布。我们将不得不假设估计的beta参数α和β没有不确定性ppppppαα\alphaββ\beta。 有三个问题: 1)理论上:仅使用beta参数的点估计值可以吗?我知道在多元线性回归中构造CI以便将来观察 ÿ= x′β+ ε ,ε 〜Ñ(0 ,σ2)ÿ=X′β+ϵ,ϵ〜ñ(0,σ2)Y = x'\beta + \epsilon, \epsilon \sim N(0, \sigma^2) 他们这样做的WRT误差项方差,。我把它(如果我错了纠正我)的理由是,在实践中σ 2估计比回归系数远远更高的精度,我们不会得到太多的试图将不确定性σ 2。类似的理由适用于估计的beta参数α和β吗?σ2σ2\sigma^2σ2σ2\sigma^2σ2σ2\sigma^2αα\alphaββ\beta 2)哪种软件包更好(R:gamlss-bb,betareg,odd ?;我也可以使用SAS)。 3)给定估计的beta参数,是否有(近似)捷径来获得未来成功计数的分位数(2.5%,97.5%),或者更好的是,根据Beta-Binomial分布获得未来成功的比例。

2
如何在线性回归中计算x截距的置信区间?
由于通常对响应变量给出线性回归的标准误差,因此我想知道如何在另一个方向上获取置信区间,例如对于x截距。我可以看到它可能是什么,但是我敢肯定必须有一种简单的方法来做到这一点。下面是R中如何形象化显示的示例: set.seed(1) x <- 1:10 a <- 20 b <- -2 y <- a + b*x + rnorm(length(x), mean=0, sd=1) fit <- lm(y ~ x) XINT <- -coef(fit)[1]/coef(fit)[2] plot(y ~ x, xlim=c(0, XINT*1.1), ylim=c(-2,max(y))) abline(h=0, lty=2, col=8); abline(fit, col=2) points(XINT, 0, col=4, pch=4) newdat <- data.frame(x=seq(-2,12,len=1000)) # CI pred <- …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.