Questions tagged «standard-error»

指从样本计算出的统计数据的样本分布的标准偏差。在形成置信区间或检验关于抽样统计数据的总体的假设时,通常需要标准误差。

3
如何解释均方根误差(RMSE)与标准偏差之间的关系?
假设我有一个模型,可以为我提供预测值。我计算这些值的RMSE。然后是实际值的标准偏差。 比较这两个值(方差)是否有意义?我的想法是,如果RMSE和标准偏差相似/相同,那么我模型的误差/方差与实际发生的情况相同。但是,如果比较这些值甚至没有意义,那么这个结论可能是错误的。如果我的想法是正确的,那么这是否意味着该模型就足够好了,因为它不能归因于造成差异的原因是什么?我认为最后一部分可能是错误的,或者至少需要更多信息来回答。


1
边际效应标准误差如何使用增量法?
我有兴趣更好地理解delta方法,以近似包括交互项的回归模型的平均边际效应的标准误差。我已经研究了增量方法下的相关问题,但没有一个提供了我想要的东西。 考虑以下示例数据作为激励示例: set.seed(1) x1 <- rnorm(100) x2 <- rbinom(100,1,.5) y <- x1 + x2 + x1*x2 + rnorm(100) m <- lm(y ~ x1*x2) 我感兴趣的平均边际效应(AMES)x1和x2。为了计算这些,我只需执行以下操作: cf <- summary(m)$coef me_x1 <- cf['x1',1] + cf['x1:x2',1]*x2 # MEs of x1 given x2 me_x2 <- cf['x2',1] + cf['x1:x2',1]*x1 # MEs of x2 given x1 mean(me_x1) …

2
如何得出线性回归系数的标准误差
对于 给定数据集单变量线性回归模型 ,系数估计为 根据book和Wikipedia,的标准错误是 和原因? d = { (X 1,ÿ 1),。。。,(X Ñ,ÿ Ñ)} β 1 = Σ 我X 我ÿ 我 - ñ ˉ X ˉ ÿÿ一世= β0+ β1个X一世+ ϵ一世ÿ一世=β0+β1个X一世+ϵ一世y_i = \beta_0 + \beta_1x_i+\epsilon_iD = { (x1个,ÿ1个),。。。,(xñ,ÿñ)}d={(X1个,ÿ1个),。。。,(Xñ,ÿñ)}D=\{(x_1,y_1),...,(x_n,y_n)\}β^1个= ∑一世X一世ÿ一世− n x¯ÿ¯ñ X¯2− ∑一世X2一世β^1个=∑一世X一世ÿ一世-ñX¯ÿ¯ñX¯2-∑一世X一世2\hat\beta_1=\frac{\sum_ix_iy_i-n\bar x\bar y}{n\bar x^2-\sum_ix_i^2} β^0= y¯- β^1个X¯β^0=ÿ¯-β^1个X¯\hat\beta_0=\bar y - \hat\beta_1\bar …


1
当解析雅可比行列可用时,最好通过
假设我正在计算一些模型参数,以使残差平方和最小化,并且我假设我的误差是高斯分布。我的模型产生解析导数,因此优化器不需要使用有限差分。拟合完成后,我要计算拟合参数的标准误差。 通常,在这种情况下,误差函数的Hessian通过以下与协方差矩阵相关: 其中是残差的方差。σ2H−1=Cσ2H−1=C \sigma^2 H^{-1} = C σ2σ2\sigma^2 如果没有可用的误差解析导数,则通常无法计算Hessian,因此将作为一个很好的近似值。JTJJTJJ^TJ 但是,就我而言,我有一个解析J,因此对我来说,通过有限差分J计算H相对便宜。 因此,我的问题是:使用我的精确J并应用上述近似值来近似H还是通过有限差分J来近似H会更准确吗?

5
如何显示交叉(配对)实验的误差线
以下场景已成为调查者(I),审阅者/编辑者(R,与CRAN不相关)和我(M)这三者中的最常见问题解答,是情节创建者。我们可以假设(R)是典型的医学大老板评论者,他只知道每个图都必须有误差条,否则是错误的。当涉及到统计审查员时,问题就不那么重要了。 情境 在典型的药理交叉研究中,测试了两种药物A和B对葡萄糖水平的影响。每位患者均按随机顺序进行两次测试,并且假定没有残留。主要终点是葡萄糖(BA)之间的差异,我们假设配对t检验就足够了。 (I)想要显示两种情况下的绝对葡萄糖水平的图。他担心(R)对误差条的需求,并要求在条形图中出现标准误差。让我们不要在这里开始条形图战争。 (I):那不是真的。条形重叠,并且我们有p = 0.03?那不是我在高中学到的。 (M):我们在这里有一个配对的设计。要求的误差线完全不相关,计数的是配对差异的SE / CI,图中未显示。如果我可以选择,并且没有太多数据,那么我希望使用以下图表 新增1:这是几个响应中提到的平行坐标图 (M):这些线显示了配对,并且大多数线都向上,这是正确的印象,因为斜率才是最重要的(好吧,这是绝对的,尽管如此)。 (I):那张照片令人困惑。没有人理解它,并且没有错误条(R在潜伏)。 (M):我们还可以添加另一个图,以显示差异的相关置信区间。距零线的距离给人以效果大小的印象。 (I):没人做 (R):它浪费了珍贵的树木 (男):(作为一个好德国人):是的,在树上指点了。但是,当我们进行多种处理和多种对比时,我还是会使用它(并且永远不会将其发布)。 有什么建议吗?如果要创建绘图,R代码在下面。 # Graphics for Crossover experiments library(ggplot2) library(plyr) theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines"))) n = 20 effect = 5 set.seed(4711) glu0 = rnorm(n,120,30) glu1 = glu0 + rnorm(n,effect,7) dt = data.frame(patient = rep(paste0("P",10:(9+n))), treatment = rep(c("A","B"), each=n),glucose …

3
如何计算逻辑回归系数的标准误差
我正在使用Python的scikit-learn来训练和测试逻辑回归。 scikit-learn返回自变量的回归系数,但不提供系数的标准误差。我需要这些标准误差来为每个系数计算Wald统计量,然后依次将这些系数进行比较。 我发现了一种关于如何计算逻辑回归系数的标准误差的描述(此处),但是很难理解。 如果您碰巧知道有关如何计算这些标准误差的简单明了的解释,并且/或者可以为我提供一个简单的解释,我将不胜感激!我并不是指特定的代码(尽管请随意发布任何可能有用的代码),而是对所涉及步骤的算法解释。

3
使用岭回归时如何估算系数标准误差?
我正在对高度多重共线性的数据使用岭回归。使用OLS,由于多重共线性,我在系数上获得了很大的标准误差。我知道岭回归是解决此问题的一种方法,但是在我看过的岭回归的所有实现中,均未报告系数的标准误差。我想通过某种方式来估计岭回归对减少特定系数的标准误差有多大帮助,从而估算出某种程度的帮助。有什么方法可以在岭回归中估算它们?

1
多元回归系数的标准误差?
我意识到这是一个非常基本的问题,但是我在任何地方都找不到答案。 我正在使用正态方程或QR分解计算回归系数。如何计算每个系数的标准误差?我通常认为标准错误的计算方式如下: SEx¯ =σx¯n√SEx¯ =σx¯nSE_\bar{x}\ = \frac{\sigma_{\bar x}}{\sqrt{n}} 什么是的每个系数?在OLS上下文中最有效的计算方法是什么?σx¯σx¯\sigma_{\bar x}

3
标准错误如何工作?
最近,我一直在研究标准错误的内部机制,但发现自己无法理解它的工作原理。我对标准误差的理解是它是样本均值分布的标准偏差。我的问题是: •当我们通常只采集一个样本时,我们如何知道标准误差是样本均值的标准偏差? •为什么计算标准误差的方程式不能反映单个样品的标准偏差方程式?

3
为什么我们需要引导程序?
我目前正在阅读拉里·瓦瑟曼(Larry Wasserman)的“所有统计信息”,并对他在有关估计非参数模型的统计函数的章节中写的内容感到困惑。 他写了 “有时我们可以通过一些计算找到统计函数的估计标准误差。但是,在其他情况下,如何估计标准误差并不明显”。 我想指出的是,在下一章中,他将讨论引导程序以解决此问题,但是由于我不太了解该声明,因此我没有完全获得引导程序背后的动力吗? 当不清楚如何估计标准误差时,有什么例子呢? 所有迄今为止我见过的例子已经“明显”,如然后^ 小号È(p Ñ)= √X1个,。。。Xñ 乙ë - [R (p )X1,...Xn Ber(p)X_1,...X_n ~Ber(p)小号Ë^(p^ñ)= p^⋅ (1 − p^)/ n----------√se^(p^n)=p^⋅(1−p^)/n \hat{se}(\hat{p}_n )=\sqrt{\hat{p}\cdot(1-\hat{p})/n}

2
计算加权均值估计中的标准误差
假设w1,w2,…,wnw1,w2,…,wnw_1,w_2,\ldots,w_n和x1,x2,...,xnx1,x2,...,xnx_1,x_2,...,x_n分别从某些分布中得出iid,wiwiw_i独立于xixix_i。该wiwiw_i是严格为正。您观察到所有的wiwiw_i,但没有观察到xixix_i;相反,您观察到∑ixiwi∑ixiwi\sum_i x_i w_i。我有兴趣根据此信息估算。显然,估计 ˉ X = Σ 我瓦特我X 我E[x]E⁡[x]\operatorname{E}\left[x\right] 是无偏的,可以根据手头的信息进行计算。x¯=∑iwixi∑iwix¯=∑iwixi∑iwi \bar{x} = \frac{\sum_i w_i x_i}{\sum_i w_i} 如何计算此估算器的标准误差?对于其中副壳体只消值0和1,I天真地试图 小号Ë 听,说:√xixix_i 基本上忽略了的变化W¯¯我,却发现这个表现不佳的样本量250比周围小(这可能取决于的方差W¯¯我。)看来,也许我不有足够的信息来计算“更好”的标准误差。se≈x¯(1−x¯)∑iw2i−−−−−−−−−−−−√∑iwi,se≈x¯(1−x¯)∑iwi2∑iwi, se \approx \frac{\sqrt{\bar{x}(1-\bar{x})\sum_i w_i^2}}{\sum_i w_i}, wiwiw_iwiwiw_i

2
如果“标准误差”和“置信区间”衡量的是测量精度,那么精度的测量是什么?
在第40页的“傻瓜生物统计学”一书中,我读到: 标准误差(缩写为SE)是表明您对某物的估计或测量的精确度的一种方法。 和 置信区间提供了另一种方法来指示某事物的估计或度量的精度。 但是,没有任何关于如何指示测量精度的文章。 问题:如何指示某物的测量精度如何?有哪些方法? 不要与测试的准确性和准确性相混淆:https : //en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification

2
计算逻辑回归的置信区间
我正在使用二项式逻辑回归来确定是否暴露has_x或has_y影响用户点击某事的可能性。我的模型如下: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) 这是我模型的输出: Call: glm(formula = has_clicked ~ has_x + has_y, family = binomial(), data = active_domains) Deviance Residuals: Min 1Q Median 3Q Max -0.9869 -0.9719 -0.9500 1.3979 1.4233 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.504737 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.