Questions tagged «terminology»

统计中特定技术用语/概念的用法和含义。


5
“ p值”的正确拼写(大写,斜体,连字符)吗?
我意识到这是古怪而陈腐的,但是作为统计学之外的领域的研究人员,由于统计学方面的正规教育有限,我总是想知道我是否正确地编写了“ p值”。特别: “ p”应该大写吗? “ p”是否应该斜体显示?(或以数学字体显示在TeX中?) 在“ p”和“值”之间应该有连字符吗? 或者,根本没有“ p”值的“正确”写法,如果我只是在这些选项的某些排列中将“ p”放在“ value”旁边,那么任何理解都会理解我的意思吗?

6
记住敏感性,特异性,准确性,准确性和召回率之间差异的最佳方法是什么?
尽管已经看过502847894789次这些术语,但我一生都无法记住灵敏度,特异性,精度,准确性和召回率之间的差异。它们是非常简单的概念,但是名称对我来说是非常不直观的,因此我一直使它们彼此混淆。什么是考虑这些概念的好方法,以便使名称开始有意义? 换句话说,为什么为这些概念选择了这些名称,而不是其他一些名称?

15
最令人困惑的统计术语
我们的统计学家使用的词语与其他人使用的词语略有不同。当我们教或解释我们在做什么时,这会引起很多问题。我将开始一个列表(现在,我将在每个注释中添加一些定义): 力量是正确拒绝错误的虚假假设的能力。通常,这意味着正确地说“正在发生”。 偏见-如果统计数据与关联的总体参数在系统上有所不同,则该统计数据将产生偏差。 显着性-在以下情况下,结果在统计上具有一定百分比(通常为5%)的显着性:如果样本来源的总体的真实影响为0,则仅会发生至少与样本来源的统计一样极端的统计数据5%的时间。 相互作用-如果因变量和一个自变量之间的关系在另一个自变量的不同级别上不同,则两个自变量相互作用 但是必须有很多其他人!

6
残差是“预测的减去实际值”还是“预测的实际减去值”
我已经看到“残差”被不同定义为“预测的减去实际值”或“实际的减去预测值”。为了说明目的,为了显示两个公式都被广泛使用,请比较以下Web搜索: 剩余的“预测的减去实际的” 剩余的“实际减去预期” 在实践中,几乎没有任何区别,因为单个残差的符号通常并不重要(例如,平方或取绝对值)。但是,我的问题是:这两个版本之一(预测优先与实际优先)是否被视为“标准”?我希望在使用中保持一致,因此,如果有完善的常规标准,我希望遵循它。但是,如果没有标准,我很乐意接受这作为答案,只要可以令人信服地证明没有标准约定。

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
为什么将MA(q)时间序列模型称为“移动平均值”?
当我阅读与时间序列有关的“移动平均值”时,我认为类似或加权平均值,例如0.5xt−1+0.3xt−2+0.2xt−3。(我意识到这些实际上是AR(3)模型,但这是我的大脑要跳到的模型。)为什么MA(q)模型的误差项或“创新”公式?是什么{ε}与移动平均办?我觉得我似乎缺少一些直觉。(xt−1+xt−2+xt−3)3(xt−1+xt−2+xt−3)3\frac{(x_{t-1} + x_{t-2} + x_{t-3})}30.5xt−1+0.3xt−2+0.2xt−30.5xt−1+0.3xt−2+0.2xt−30.5x_{t-1} + 0.3x_{t-2} + 0.2x_{t-3}{ϵ}{ϵ}\{\epsilon\}


3
正态分布和高斯分布有什么区别
正态分布和高斯分布之间有很大的区别吗?我看过很多论文都在不加区分地使用它们,而且我通常也将它们称为同一事物。 但是,我的PI最近告诉我,正常情况是高斯的均值= 0和std = 1的特定情况,我早些时候在另一家商店也听说过,对此有何共识? 根据维基百科,他们称之为正态分布的是标准正态分布,而正态分布是高斯的同义词,但是话又说回来,我也不确定维基百科。 谢谢

4
预测和预测之间的区别?
我想知道预测和预测之间有什么区别和关系?特别是在时间序列和回归方面? 例如,我是否纠正: 在时间序列中,预测似乎意味着在给定时间序列的过去值的情况下估计未来值。 在回归中,预测似乎意味着估计给定数据的值是未来,当前还是过去。 谢谢并恭祝安康!

8
预测和推理之间有什么区别?
我正在阅读“ 统计学习入门 ”。在第二章中,他们讨论了估计函数的原因。Fff 2.1.1为什么估计?Fff 我们可能希望估计f有两个主要原因:预测和推断。我们依次讨论每一个。 我已经读了好几次了,但是我仍然对预测和推理之间的区别还不清楚。有人可以提供差异的(实际)示例吗?




1
L1正则化的回归与套索是否相同,L2正则化的回归与岭回归是否相同?以及如何写“套索”?
我是一名学习机器学习的软件工程师,尤其是通过Andrew Ng的机器学习课程学习机器学习。在研究带有正则化的线性回归时,我发现令人困惑的术语: 使用L1正则化或L2正则化进行回归 套索 岭回归 所以我的问题是: L1正则化的回归与LASSO完全相同吗? L2正则化的回归与Ridge回归完全相同吗? LASSO是如何写作的?应该是“ LASSO回归”吗?我见过类似“ 套索更合适 ”的用法。 如果以上1和2的答案是“是”,那么为什么这两个术语有不同的名称?“ L1”和“ L2”是否来自计算机科学/数学,而“ LASSO”和“ Ridge”是否来自统计? 当我看到类似以下内容的帖子时,这些术语的使用会造成混淆: “ L1和L2正则化有什么区别? ”(quora.com) “ 什么时候应该使用套索vs岭? ”(stats.stackexchange.com)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.