我不是统计学家,但我的研究工作涉及统计学(分析数据,阅读文献等)。我在这里发表的一个问题的评论再次提醒我,对于那些在统计学领域有良好实践经验的人,有些常用词具有特别的含义或内涵。
列出此类单词可能会有所帮助,并且可能是短语以及一些注释。
我不是统计学家,但我的研究工作涉及统计学(分析数据,阅读文献等)。我在这里发表的一个问题的评论再次提醒我,对于那些在统计学领域有良好实践经验的人,有些常用词具有特别的含义或内涵。
列出此类单词可能会有所帮助,并且可能是短语以及一些注释。
Answers:
“正常” -在普通的言语中,正常是指预期的结果,并非与众不同。在统计中,如果变量是正态分布的,则是指高斯分布。我不认为将“正常”一词大写以区别于通常的语音含义是标准的。
“归一化/标准化” -在统计数据中,对变量进行归一化意味着减去均值并除以标准差。
“标准偏差与标准误差” -标准偏差通常是使用整个总体计算得出的,而标准误差是使用样本计算得出的。
样本:虽然在统计中是指一组案例,但在许多其他学科中,样本是一个物理样本。当然,样本数量也是模棱两可的,是指统计样本中的病例数或样本的物理大小(质量,体积等)。
敏感性:用于医学诊断,测试可识别出患病病例的比例。在分析化学中:校准曲线的斜率(请参见下文)。
特异性:在医学诊断中,由测试正确识别的非疾病病例的比例。在分析化学中,如果没有交叉敏感性,则该方法是特定的。
标定:实际上,Wiki文章中已经列出了两种含义以供统计。在化学和物理学中,反向回归的含义是通常的含义。但是,会产生混乱:
验证集:在这里,我想提请注意可能会混淆使用的术语,尽管我再次对比,但我认为这些术语已经出现在与统计相关的不同字段中。在嵌套/双重验证或优化与验证/测试的上下文中,一行术语将训练(validation)-测试(test)分开,并使用“ validation”集来优化超参数。
例如,《统计学习的要素》,第2页。第二版222。:
...将数据集分为三部分:训练集,验证集和测试集。训练集用于拟合模型;验证集用于估计模型选择的预测误差;测试集用于评估最终选择的模型的泛化误差。
相比之下,例如在分析化学验证中,该过程证明了该模型(实际上,对最终模型的评估只是分析方法验证的一部分)对于该应用程序而言效果良好,并可以衡量其性能,例如,参见John K. Taylor:分析方法的验证,《 Analytical Chemistry 1983 55(6)》,600A-608A
或FDA等机构的指南。这将是另一行术语中的“测试”,其中“验证”实际上用于优化。
关键区别在于,“优化验证”结果将用于更改(选择)模型,而经过验证的分析方法(包括数据分析模型)的更改意味着您必须重新验证 (即证明该方法仍然可以正常工作)。
如果您碰巧需要与化学家交谈,则最好使用Danzer:分析化学术语-分析化学-理论和计量基础知识,DOI 10.1007 / b103950