Questions tagged «standard-deviation»

标准差是随机变量,其估计量或一批数据的散布的类似度量的方差的平方根。


3
区别在于摘要统计:基尼系数和标准偏差
有几个摘要统计信息。当您要描述分布的分布时,可以使用例如标准差或基尼系数。 我知道标准偏差是基于中心趋势,即与均值的偏差,基尼系数是色散的一般度量。我也知道,基尼系数具有上限和下限[0 1],而标准偏差则没有。这些属性是很好知道的,但是标准偏差可以提供哪些见解,使基尼无法做到,反之亦然?如果我不得不选择使用两者之一,那么在提供信息和洞察力方面,与另一种相比使用一种优势是什么?

3
要报告的有效位数
在比较标准的情况下(例如,大学一年级),是否有更科学的方法来确定要报告的平均位数或置信区间的有效位数。 我已经看到要在表格中放置有效数字的数量,为什么我们不使用有效数字和卡方拟合的有效数字的数量,但是这些似乎并没有使问题产生影响。 在我的课堂上,我试图向学生解释,当他们的成绩有如此大的标准误差时,报告15位有效数字是浪费墨水-我的直觉是应该将其四舍五入到大约。这与ASTM- 报告测试结果所指的E29并没有太大区别,在E29中,该值应介于和。0.05 σ 0.5 σ0.25σ0.25σ0.25\sigma0.05σ0.05σ0.05\sigma0.5σ0.5σ0.5\sigma 编辑: 当我有如下一组数字时x,我应该使用几位数来打印均值和标准差? set.seed(123) x <- rnorm(30) # default mean=0, sd=1 # R defaults to 7 digits of precision options(digits=7) mean(x) # -0.04710376 - not far off theoretical 0 sd(x) # 0.9810307 - not far from theoretical 1 sd(x)/sqrt(length(x)) # standard error of mean …

3
绘制结果仅具有平均值和标准偏差
我正在尝试在此表中的观察值和召回得分的标准差的可视化中绘制一个合适的图: 召回控制意思37标清8实验性意思21标清6控制实验性意思标清意思标清召回378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ & \text{Mean} & \text{SD} &\text{Mean} &\text{SD} \\ \hline \text{Recall} & 37 & 8 & 21 & 6 \\ \hline \end{array} 最好的方法是什么?条形图是一个好方法吗?在这种情况下如何说明标准偏差?


3
直觉和变异系数的用途
我目前正在Coursera.org上参加“ 运营管理入门”课程。在课程的某个时候,教授开始处理手术时间的变化。 他使用的度量是变异系数,即标准偏差和平均值之间的比率: Cv= σμCv=σμc_v = \frac{\sigma}{\mu} 为什么要使用此度量?除了使用标准偏差外,使用CV还有哪些优缺点?这种测量背后的直觉是什么?

3
如何从正态分布中找到样本标准偏差的标准偏差?
如果我错过了一些显而易见的事情,请原谅我。 我是一位物理学家,本质上是(直方图)分布,其中心是一个近似于正态分布的平均值。对我来说,重要的值是该高斯随机变量的标准偏差。我将如何尝试查找样本标准偏差上的误差?我感觉到它与原始直方图中每个bin上的错误有关。



2
计算NBA投篮一致性
评估/确定NBA球员三分球命中率一致性的正确方法是什么?例如,我有一个球员的三分球命中率是37%,全年要进行200次尝试。 我正在考虑拍摄任意数量(例如20张)的3分滚动平均值。然后使用这些平均值确定与37%平均值的标准偏差。使用20张滚动的滚动样本大小只能使5%的拍摄准确率,但是我担心使用过多的拍摄不会显示出性能上的不一致。 有没有更好的方法来确定一致性?

1
蒙特卡洛分析所需的模拟数量
我的问题是有关蒙特卡洛分析方法所需的模拟数量。据我所知,对于任何允许的百分比误差(例如5),所需的仿真次数为 ËËEn = { 100 ⋅ žC⋅ 标准( X )Ë⋅ 平均值(x )}2,ñ={100⋅žC⋅性病(X)Ë⋅意思(X)}2, n = \left\{\frac{100 \cdot z_c \cdot \text{std}(x)}{E \cdot \text{mean}(x)} \right\}^2 , 其中是所得采样的标准偏差,是置信度系数(例如,对于95%,它是1.96)。因此,以这种方式可以检查模拟的结果平均值和标准偏差是否代表置信度为95%的实际平均值和标准偏差。标准(x )性病(X)\text{std}(x)žCžCz_cññn 就我而言,我运行了7500次仿真,并从7500个仿真中计算出每100个样本的移动平均值和标准偏差。我获得的所需模拟次数始终小于100,但均值和标准差与整个结果的均值和标准差的百分比误差并不总是小于5%。在大多数情况下,平均值的百分比误差小于5%,但std的误差高达30%。 在不知道实际均值和标准差的情况下确定所需模拟次数的最佳方法是什么(在我的情况下,模拟结果呈正态分布)? 在此先感谢您的帮助。 为了对无限次运行迭代时模拟结果的分布情况有所了解:我决定找到结果分布的拟合函数,而不是使用n次模拟后的结果均值和方差,但是这里n必须完全填充允许的%错误。我认为通过这种方式,我可以找到与97.5%相关的累积分布函数的更正确结果。因为当我比较400和7000仿真的结果时,两个采样的分布的拟合函数看起来彼此相似,只有第二个曲线更平滑。同样,因此在MATLAB / Simulink中的模型是非线性的,尽管生成的输入参数是正态分布的,但由于我使用了“广义极值分布”,因此模拟结果的直方图也不是正态的,在MATLAB中称为“ gev”。但是,对于这种方法,我还是不太确定,谢谢您提前发出任何命令

2
误差传播SD与SE
在两个不同的条件下(A和B),我对每个人的性状有3到5个度量。 我绘制平均每个个体在每个条件和我使用标准的误差(即,,其中N=测量次数)作为误差线。小号D / N--√SD/NSD/\sqrt{N}ñNN 现在,我要绘制条件A和条件B中每个人的平均度量之间的差异。我知道我可以确定传播的误差: 但是如何传播标准误差(因为我正在处理测量的平均值)而不是标准偏差?这有道理吗?小号D = Sd2一个+ Sd2乙----------√SD=SDA2+SDB2SD=\sqrt{SD_A^2+SD_B^2}

1
如何在ARIMA模型的观察值48中加入创新的离群值?
我正在处理数据集。使用一些模型识别技术后,我得出了一个ARIMA(0,2,1)模型。 我使用R detectIO包TSA中的函数在对原始数据集进行第48次观察时检测到创新的离群值(IO)。 如何将这个离群值合并到模型中,以便将其用于预测?我不想使用ARIMAX模型,因为我可能无法根据R中的模型做出任何预测。还有其他方法可以做到吗? 以下是我的价值观: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
为什么Anova()和drop1()为GLMM提供了不同的答案?
我有以下形式的GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 当我使用时drop1(model, test="Chi"),我得到的结果与Anova(model, type="III")从汽车包装或汽车上获得的结果不同summary(model)。后两个给出相同的答案。 通过使用大量虚构数据,我发现这两种方法通常没有区别。对于平衡线性模型,不平衡线性模型(不同组中的n不相等)和平衡广义线性模型,它们给出相同的答案,但对于平衡广义线性混合模型,它们给出相同的答案。因此看来,只有在包括随机因素的情况下,这种矛盾才会显现出来。 为什么这两种方法之间存在差异? 使用GLMM时应使用Anova()还是drop1()应使用? 至少就我的数据而言,两者之间的差异很小。哪一个使用都重要吗?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.