Questions tagged «standard-error»

指从样本计算出的统计数据的样本分布的标准偏差。在形成置信区间或检验关于抽样统计数据的总体的假设时,通常需要标准误差。

3
为什么对于给定的n,比例的标准误差最大为0.5?
当所讨论的比例为0.5时,对于给定的N,比例的标准误差将是最大的,并且该比例的标准误差从0.5开始越小。当查看比例的标准误差的方程式时,我可以看到为什么会这样,但是我无法进一步解释。 除了公式的数学性质之外,还有其他解释吗?如果是这样,为什么估计比例(对于给定的N)在接近0或1时为何不确定性较小?

2
2.04标准错误的含义?当置信区间广泛重叠时,均值的显着不同吗?
下面的图片是从这篇文章中心理科学。一位同事指出了两个不寻常的事情: 根据标题,误差线显示为“±2.04标准误差,置信区间为95%”。我只见过±1.96 SE用于95%CI,而我找不到关于2.04 SE用于任何目的的任何信息。2.04 SE是否具有一些公认的含义? 案文指出,按计划进行的成对比较发现,平均惊吓幅度在误差与正确的可预测试验(t(30)= 2.51,p <.01)和误差与正确的不可预测试验(t(30)= 2.61,p <.01)(综合F检验在p <.05时也很显着)。但是,该图显示了所有三个条件的误差线基本重叠。如果±2.04 SE间隔重叠,那么在p <.05时,这些值有何显着不同?重叠部分足够大,我假设±1.96 SE间隔也重叠。

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
根据测量误差选择先验
如果您有仪器的测量误差,如何计算适当的先验值?本段摘自Cressie的书“时空数据统计”: 通常情况下,可以使用一些有关测量误差方差的先验信息,从而可以指定相当有用的参数模型。例如,如果我们假设条件独立的测量误差为iid ,那么我们应该为指定一个信息先验。假设我们对环境空气温度感兴趣,并且我们看到仪器制造商的技术指标表明“误差”为±0.1°C。假定此“错误”对应于2个标准差(应检查的假设!),然后我们可以指定\ sigma _ {\ epsilon} ^ {2}的先前平均值为(0.1 / 2)^ 2 = 0.0025Gau(0,σ2ϵ)Gau(0,σϵ2)Gau(0, \sigma_{\epsilon}^2)σ2ϵσϵ2\sigma_{\epsilon}^2±0.1°C±0.1°C±0.1°Cσ2ϵσϵ2\sigma_{\epsilon}^{2}(0.1/2)2=0.0025(0.1/2)2=0.0025(0.1/2)^2 = 0.0025。由于仪器制造商的规范,我们假设分布在0.0025处具有明确定义且相当窄的峰(例如,反伽马)。实际上,我们可以将其固定为0.0025;但是,数据模型错误也可能具有其他不确定性因素(第7.1节)。为避免过程模型错误可能引起的可识别性问题,建模人员应尽可能减少《科学》杂志的不确定性,包括进行旨在复制数据的辅助研究,这一点非常重要。 有谁知道如上所述获得先验值的一般程序是什么(尽管该段仅涉及获得先验均值)?

2
具有已知断点的分段线性回归中斜率的标准误差
情况 我有一个具有一个因变量和一个独立变量的数据集。我想用出现在已知/固定断点拟合连续分段线性回归。已知breakpoins没有不确定性,所以我不想估计它们。然后,我拟合以下形式的回归(OLS): 这是ÿÿyXXxķķk(一个1个,一个2,… ,一个ķ)(一个1个,一个2,…,一个ķ)(a_{1}, a_{2}, \ldots, a_{k})ÿ一世=β0+β1个X一世+β2最高(X一世-一个1个,0 )+β3最高(X一世-一个2,0 )+ … +βk + 1最高(X一世-一个ķ,0)+ϵ一世ÿ一世=β0+β1个X一世+β2最高⁡(X一世-一个1个,0)+β3最高⁡(X一世-一个2,0)+…+βķ+1个最高⁡(X一世-一个ķ,0)+ϵ一世 y_{i} = \beta_{0} + \beta_{1}x_{i} + \beta_{2}\operatorname{max}(x_{i}-a_{1},0) + \beta_{3}\operatorname{max}(x_{i}-a_{2},0) +\ldots+ \beta_{k+1}\operatorname{max}(x_{i}-a_{k},0) +\epsilon_{i} R set.seed(123) x <- c(1:10, 13:22) y <- numeric(20) y[1:10] <- 20:11 + rnorm(10, 0, 1.5) y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2) …


4
什么是标准误差?
我正在使用找到的教程,并绘制平均值和标准误差以显示数据。但是我在讨论结果时遇到了问题。我的图如下所示:一些标准误差(显示为误差线)变化很大,其中一些非常接近零。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.