为什么在统计数据和ML中使用“内核”这个名字?


21

在操作系统和线性代数的上下文中,其他SE网站也对此提出了要求,但是对于统计和机器学习中使用的内核方法,同样的问题使我感到困惑。

人们通常说内核(例如在内核密度估计或SVM中)代表某种相似性,但我不知道“内核”的名称来自何处以及它的象征意义。

那么,在统计和机器学习的背景下,内核的词源是什么?

明确地说,我很清楚内核是什么以及内核的主要属性,我只是对名称感到好奇,因为我不知道它与种子或核心有什么关系,因为它主要是在内核中定义的。字典。或者至少我看不到比“方法的基本部分”更深的含义。

Answers:


13

您可以通过检查网站上有关数学家Jeff Miller维护的某些数学单词的最早已知用途来找到有关此问题的一些信息。您还可以在标准词典中找到有关“内核”一词词源的信息。

弗雷德霍姆(Fredholm,1903年)以法语写作,使用了“ noyau”(核心)一词,希尔伯特(Hilbert,1904年)采用了该术语,但用德语写作,产生了德语单词“ kern”(核心)。这些术语用于泛函分析中有关积分方程的写作中。此后不久,Bôcher(1909)用英语写作,使用术语“内核”来指代相同的对象。然后,该术语遍及有关功能分析,傅立叶分析以及后来的概率和统计的英语文献。

根据以上链接的词典,该词源自古英语和原始德语。它既可以指种子,也可以指对象的核心,中心或本质。德语“ kern”和“ kernel”之间的语言相似性似乎是由于相似的历史派生所致。据称,“内核”一词源于一个假设的(重建的)原始德语单词“kurną”(玉米)。因此,根据这段历史,从词源上看,“内核”一词是指种子,核心或本质,它基于德语中一个古老的玉米词的英语化。

更新:这个答案已经过大量编辑,以反映用户cbeleitesRM引起我注意的新信息。我最初以为这可能是“ kern”一词最近的英语化,但是字典资料表明英语中的“ kernel”一词很老。我不是语言学家,所以我只列出上述来源的信息。


从未听说马克西姆·博彻(MaximeBôcher)。首先,我认为这可能是所罗门·博纳(Salomon Bochner)的错字。
Mark L.Stone

那是我的错-我不确定如何输入带重音的o。你是怎么做到的?
恢复莫妮卡

1
我复制并粘贴了Wikipedia列表。
马克·L·斯通

1
我的真实意思是我知道Bochner是内核中的巨人,但从未听说过Bocher。Bochner是Samuel Karlin的论文顾问,我从那里学习了Total Positivity(完全正内核导致变异减少转换等)。爵士乐)。
马克L.斯通

1
我不确定内核是否是Kern的Anglicized版本,至少在100多年前才发生的事情上,至少不是这样。我一直将其翻译为:merriam-webster.com/dictionary/kernel定义1在德语中称为“ Kern”。例如,对于一个苹果,种子=柯恩(Kerne),而核心=Kerngehäuse(字面上的内核)。
cbeleites支持Monica

13

在机器学习和统计中,内核被多次使用。一些示例是:

  1. 支持向量机的一个核心就是数据映射到那里的问题变得线性可解(观看高维空间的函数)。

  2. 核密度估计

    内核密度估计是一种用于估计随机变量的概率密度函数的非参数方法。

在这种情况下,内核只是内核密度估计中使用的加权函数。最后一个链接在统计中还使用了“ 内核 ”一词。

  1. 卷积神经网络中,内核是一个小的矩阵,用于执行图像与其自身之间的卷积。看这里

在所有这些示例中,内核是一种数学函数,用于对数据进行某种转换。内核本质上是该转换的恒定部分。根据我们用于每次转换的内核选择,我们可能会从中获得不同的效果。


5
βË-βXË-βX

7
OP正在寻找内核的词源。
Franck Dernoncourt '18 -4-20

2
在机器学习中,使用“核”来指代线性代数中的零空间是否与这些用法有任何关系?
syntonicC
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.