Questions tagged «measurement-error»

测量误差是一个量的测量值与其真实值之差。

2
ImageNet:什么是top-1和top-5错误率?
在ImageNet分类论文中,top-1和top-5错误率是衡量某些解决方案成功与否的重要单位,但是这些错误率是多少? 在Krizhevsky等人的《具有深度卷积神经网络的ImageNet分类 》中。每个基于一个CNN的解决方案(第7页)都没有前5个错误率,而具有5个和7个CNN的解决方案则有5个错误率(而且7个CNN的错误率比5个CNN的更好)。 这是否意味着top-1错误率是一个CNN的最佳单一错误率? 前五位的错误率仅仅是五个CNN的累积错误率吗?

4
真值为零时如何计算相对误差?
当真实值为零时,如何计算相对误差? 假设我有和。如果我将相对误差定义为:xtrue=0xtrue=0x_{true} = 0xtestxtestx_{test} relative error=xtrue−xtestxtruerelative error=xtrue−xtestxtrue\text{relative error} = \frac{x_{true}-x_{test}}{x_{true}} 那么相对误差总是不确定的。如果相反,我使用定义: relative error=xtrue−xtestxtestrelative error=xtrue−xtestxtest\text{relative error} = \frac{x_{true}-x_{test}}{x_{test}} 那么相对误差总是100%。两种方法似乎都没有用。还有其他选择吗?

5
如何在机器学习中处理分层/嵌套数据
我将用一个例子来解释我的问题。假设您要根据以下属性预测个人的收入:{年龄,性别,国家/地区,城市}。你有一个像这样的训练数据集 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
您如何解释RMSLE(均方根对数误差)?
我一直在进行机器学习竞赛,他们使用RMSLE(均方根对数误差)评估性能,从而预测一类设备的销售价格。问题是我不确定如何解释最终结果的成功。 例如,如果我达到了的RMSLE,是否可以将它的指数幂提高并像rmse一样解释它?(即)?e e 1.052 = 2.863 = R M S E1.0521.0521.052ËËeË1.052= 2.863 = R M小号ËË1.052=2.863=[R中号小号Ëe^{1.052}=2.863=RMSE 然后,我能否说我的预测平均为实际价格的?还是有更好的方法来解释指标?还是除了与其他模型的其他RMSLE进行比较外,甚至可以完全解释该指标? ± $ 2.863±$2.863\pm \$2.863


1
来自随机数生成器的截断数字是否仍然是“随机”的?
在这里,“截断”意味着降低随机数的精度,而不是截断随机数序列。例如,如果我有具有任意精度的真正随机数(从任何分布中抽取,例如,正态,均等),然后我将所有数字截断,以便最终我得到一组个数,每个数字都与小数点后2位。我可以称这组新数字为“随机”吗?ñnnnnnn 当我阅读有关硬件生成的随机数时,我想到了这个问题。维基百科的文章说,他们通过测量物理过程来生成随机数。但是由于这种测量有其局限性(测量误差,有限精度等),我们可以将这些硬件生成的数字称为随机数吗?

2
加权主成分分析
经过一番搜索,我发现将观测权重/测量误差纳入主成分分析的内容很少。我发现的结果倾向于依靠迭代方法来包含权重(例如,here)。我的问题是为什么需要这种方法?为什么我们不能使用加权协方差矩阵的特征向量?

1
AUC是半正确的评分规则意味着什么?
正确的计分规则是“真实”模型最大化的规则,并且不允许“对冲”或对系统进行博弈(故意报告不同结果,因为该模型的真实信念是提高分数)。石棉分数是适当的,准确性(正确分类的比例)是不适当的,并且经常受到阻碍。有时我会看到AUC被称为半正确评分规则,这使其准确性不完全虚假,但不如适当规则敏感(例如,此处/stats//a/90705/53084)。 半正确评分规则是什么意思?它在某处定义吗?

2
如果“标准误差”和“置信区间”衡量的是测量精度,那么精度的测量是什么?
在第40页的“傻瓜生物统计学”一书中,我读到: 标准误差(缩写为SE)是表明您对某物的估计或测量的精确度的一种方法。 和 置信区间提供了另一种方法来指示某事物的估计或度量的精度。 但是,没有任何关于如何指示测量精度的文章。 问题:如何指示某物的测量精度如何?有哪些方法? 不要与测试的准确性和准确性相混淆:https : //en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
我可以将协方差矩阵转换为变量的不确定性吗?
我有一个GPS单元,它通过协方差矩阵输出噪声测量值:ΣΣ\Sigma Σ=⎡⎣⎢σxxσyxσxzσxyσyyσyzσxzσyzσzz⎤⎦⎥Σ=[σxxσxyσxzσyxσyyσyzσxzσyzσzz]\Sigma = \left[\begin{matrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{xz} & \sigma_{yz} & \sigma_{zz} \end{matrix}\right] (有也是参与,但我们忽略了一秒钟。)ttt 假设我想告诉其他人,每个方向()的精度都是某个数字。μ X,μ ÿ,μ ž。也就是说,我的GPS可以给我的阅读X = ˉ X ± μ X,等等。我的理解是,μ在这种情况下,意味着所有被测量是彼此独立的(即协方差矩阵对角线)。此外,找到矢量误差就像在正交中求和(平方和的平方根)一样简单。x,y,zx,y,zx,y,zμx,μy,μzμx,μy,μz\mu_x, \mu_y, \mu_zx=x¯±μxx=x¯±μxx=\bar{x}\pm\mu_xμμ\mu 如果我的协方差矩阵不是对角线会怎样?是否存在一个包含y和z方向影响的简单数字?如何找到给定的协方差矩阵?μ∗xμx∗\mu_x^*yyyzzz

2
当具有基于不同样本量的组平均值的预测变量时,该怎么办?
考虑一个经典的数据分析问题,其中您有一个结果YiYiY_{i},以及它与多个预测变量Xi1,...,XipXi1,...,XipX_{i1}, ..., X_{ip}。这里要考虑的基本应用程序类型是 YiYiY_{i}是某些团体级别的结果,例如市的犯罪率iii。 预测变量是组级别的特征,例如城市人口统计学特征iii。 基本目标是拟合回归模型(可能具有随机效应,但暂时不要考虑): E(Yi|Xi)=β0+β1Xi1+...+βpXipE(Yi|Xi)=β0+β1Xi1+...+βpXip E(Y_{i} | {\bf X}_{i} ) = \beta_0 + \beta_1 X_{i1} + ... + \beta_p X_{ip} 当一个(或多个)预测变量是每个单位样本量不同的调查结果时,是否会出现技术上的困难?例如,假设Xi1Xi1X_{i1}是城市总分,iii它是来自城市的个体样本的平均响应,iii但是这些平均值所基于的样本量却大不相同: City12345⋮Sample size2010030053⋮CitySample size120210033004553⋮⋮\begin{array}{c|c} {\rm City} & {\rm Sample \ size} \\ \hline 1 & 20 \\ 2 & 100 \\ 3 & 300 \\ 4 & 5 …

1
加法误差还是乘法误差?
我是统计学的新手,不胜感激可以帮助您更好地理解这一点。 在我的领域中,有以下形式的常用模型: PŤ= PØ(五Ť)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha 当人们将模型拟合到数据时,他们通常将模型线性化并符合以下条件 日志(PŤ)= 日志(PØ)+ α 日志(五Ť)+ ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon 这个可以吗?我在某处读到,由于信号中的噪声,实际模型应该是 PŤ= PØ(五Ť)α+ ϵPt=Po(Vt)α+ϵP_t = P_o(V_t)^\alpha + \epsilon 并且不能像上面那样线性化。这是真的?如果是这样,是否有人知道我可以阅读和参考的参考文献,并且可能在报告中引用?

3
如何从正态分布中找到样本标准偏差的标准偏差?
如果我错过了一些显而易见的事情,请原谅我。 我是一位物理学家,本质上是(直方图)分布,其中心是一个近似于正态分布的平均值。对我来说,重要的值是该高斯随机变量的标准偏差。我将如何尝试查找样本标准偏差上的误差?我感觉到它与原始直方图中每个bin上的错误有关。

4
如何在回归模型中概念化误差?
我正在参加数据分析课程,而我一些根深蒂固的想法正在动摇。即,误差(ε)以及任何其他类型的方差的想法仅(据我认为)适用于一组(样本或整个人群)。现在,我们被告知回归假设之一是方差“对于所有个体都是相同的”。这在某种程度上令我震惊。我一直认为,假设所有X值中Y的方差都是恒定的。 我与教授聊天,他告诉我,当我们进行回归分析时,我们认为我们的模型是正确的。我认为那是棘手的部分。对我而言,误差项(epsilon)始终表示“诸如我们不知道的任何元素,它们可能会影响我们的结果变量,以及一些测量误差”。在课堂教学中,没有“其他东西”之类的东西。我们的模型假设是真实完整的。这意味着必须将所有残差视为测量误差的乘积(因此,一次测量20个人将产生与一次测量20个人相同的方差)。 我觉得某处有问题,对此我希望有一些专家意见...从概念上来讲,关于错误术语是什么还可以解释吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.