当我向学生介绍概念时,经常会发现告诉他们术语的起源很有趣(例如,“回归”是一个有意思的起源的术语)。我还没有找到统计/机器学习中“正则化”一词的历史/背景。
那么,正则化一词的起源是什么?
当我向学生介绍概念时,经常会发现告诉他们术语的起源很有趣(例如,“回归”是一个有意思的起源的术语)。我还没有找到统计/机器学习中“正则化”一词的历史/背景。
那么,正则化一词的起源是什么?
Answers:
与马修·冈恩(Matthew Gunn)的贡献类似,这也不是一个真正的答案,而更像是一个可行的候选人。
我也首先听说过Tikhonov正则化中的“正则化”一词,尤其是在地球物理学中的(线性)逆问题中。有趣的是,虽然我认为这可能是由于我的学习领域(即查看我的用户名),但显然Tikhonov实际上在该领域做了很多工作!
我的直觉是,现代的“转正”的方式可能也与吉洪诺夫的工作起源。基于这种推测,我在这里的贡献分为两个部分。
第一部分是(扶手椅)历史性的(基于细读论文标题和我自己先前的偏见!)。尽管在1963年发表的论文《错误地提出问题的解决方案和正则化方法》似乎是“正则化”一词的首次使用,但我不确定这是真的。此参考在Wikipedia中被引用为
提科霍诺夫(1963)。“Орешениинекорректнопоставленныхзадачиметодерегуляризации”。Doklady Akademii Nauk SSSR。151:501-504。翻译为“错误地提出问题的解决方案和正则化方法”。苏联数学。4:1035-1038。
给人的印象是,季克霍诺夫本人至少本来是用俄语写这些作品的,所以“正规化”一词可能是后来的译者创造的。[更新:不,“регуляризации” =正则化,请参见Cagdas Ozgenc的评论。]此外,这项工作似乎是Tikhonov进行的长期研究的一部分。例如纸
提克霍诺夫(Tikhonov),安德烈(Andrey Nikolayevich)(1943)。“关于反问题的稳定性]。”Обустойчивостиобратныхзадач“。Doklady Akademii Nauk SSSR。39(5):195–198。
表明他至少在20年前参与了相同的一般主题。但是,该时间表表明,反问题工作可能始于1963年而不是1943年。
[ 更新:1943年论文的译本表明,“ 正则性 ” 的术语在此用于指“反问题的稳定性(或反映射的连续性)”。]
我的贡献的第二部分是关于在这种情况下最初打算如何进行“正则化”的假设。通常将“规则”用作“平滑”的同义词,特别是在描述曲线和/或曲面几何形状时。在大多数地球物理应用中,理想的解决方案是对空间分布的字段进行网格估计,并使用Tikhonov正则化来强加平滑度。
(Tikhonov矩阵通常是类似于PDE矩阵的离散空间导数算子,而岭回归的恒等矩阵。这是因为对于这些网格/正向模型,正向模型矩阵的零空间趋向于包括像“棋盘模式”,将污染的结果,除非处罚;类似这样)。
更新:这些问题在我的答案说明这里。
摘要
(*基于1943年论文的最新报价,该措辞似乎是正确的……但是出于错误的原因!相关的“地图” 不在网格和字段之间,,但是正向模型的逆映射。)θ = F − 1 [ u ]
这是部分答案,部分是长评论。候选人名单不完整:
蒂霍诺夫,安德烈。“解决公式错误的问题和正则化方法。” 苏联数学。Dokl .. Vol。1963年5月。Tikhonov以Tikhonov正则化(也称为岭回归)而闻名。
物理学中有一个正则化的概念至少可以追溯到1940年代,但是我不认为与Tikhonov正则化有任何关系?(我不是物理学家。)
工程文献谈到至少可以追溯到1880年代的河流正则化(以改善航行)。
在http://books.google.com上进行搜索之前,直到1970年代,“正规化”一词在数学和物理书籍中一次又一次地出现后,才得到广泛使用。