“学习模型”一词从何而来


10

我经常听到这里的数据挖掘者使用这个术语。作为从事分类问题的统计学家,我熟悉术语“训练分类器”,并且我认为“学习模型”的意思是相同的。我不介意“训练分类器”。这似乎描绘了拟合模型的想法,因为训练数据用于获得模型参数的良好或“改进的”估计。但是,学习会获得知识。用简单的英语来说,“学习模型”就是要知道它是什么。但是实际上,我们从不“知道”模型。模型近似于现实,但没有模型是正确的。就像Box所说的:“没有正确的模型,但有些有用。”

我想听听数据挖掘者的回应。该术语是如何产生的?如果使用它,为什么喜欢它?


有趣的是,“学习模型”的意思最多就是“记住其所有参数”,因此即使您在这里不会争论“学习”是否是一个好词,也是不正确的。用我的语言(pl),官方术语是“教模型”,尽管“机器学习”被称为“机器学习”而不是“机器教学”。

边栏:您是否有Box报价的参考。

Answers:


8

我怀疑它的起源是在人工神经网络研究社区中,在该社区中,神经网络可以被认为是通过修改突触权重来学习数据模型的,其方式类似于在我们自己学习时在人脑中发生的方式经验。我的研究生涯始于人工神经网络,因此有时会使用该短语。

如果您认为模型是在模型的参数中而不是方程式中编码的,则可能更有意义,就像心理模型不能像一组参数那样是可识别的大脑物理组成部分一样一些神经元的设置。

注意,这并不意味着心理模型也一定是正确的!


1
我的研究负责人和我进行了讨论,并在stats.stackexchange.com/questions/43559/…上发布了与此讨论相关的问题。我了解到,模型拟合,训练,估计和学习只是意味着应用某种优化方法来找到定义特定形式的模型的最佳参数。

6

这个术语在人工智能方面很老。图灵在其1950年发表于Mind的计算机械与情报》一文中专门论述了“学习机器” ,并定性地勾勒出监督学习的方式。Rosenblatt的原始论文:感知器:大脑中信息存储和组织的概率模型自1958年以来发表,论文广泛讨论了“学习的数学模型”。这里的感知器是“学习的模型”。模型不是“学习”的。

Pitts and McCullough 1943年发表的论文-最初的“神经网络”论文-并不真正关注学习,更多地是如何构造逻辑演算(例如Hilbert或Gentzen系统,但我认为它们是指Russell / Whitehead)。可以进行推断。我认为正是“感知器”论文引入了数字,而不是这种传统的象征性学习概念。

机器是否可能仅通过示例来学习如何下棋?是。它有下棋的模型吗?是。它是最佳模型(假设有一个模型)吗?几乎可以肯定。用简单的英语,我可以“学象棋”,如果我可以下象棋的话-也许还不错。这并不意味着我是最佳的棋手。这就是图灵在论文中讨论学习国际象棋时描述“学习”的意义。

我与我使用的术语非常不一致。因此(例如)对于极限学习,我说“识别”,对于SVM学习,我说“训练”,但对于MCMC,“学习”,我说“优化”。例如,我只称回归为“回归”。


我的问题不是关于在分类中使用学习一词,而是关于“学习模型”一词。机器学习非常熟悉,但是“学习模型”是我在此站点上第一次听到的短语。
Michael R. Chernick

我在此处添加了一些内容,但是您是对的,这不是一个很好的答案,我希望在没有过多讨论“模型”的情况下进行学习。我将拭目以待,今天是否还能记住任何内容,但如果没有任何想法,我可能会在今天晚上将其删除。
Patrick Caldon 2012年

我打算删除此答案,但显然有一些人喜欢它!我想这是在这种情况下“学习”一词的合理概括。
Patrick Caldon 2012年

+1我给出了赞誉,因为尽管这个问题有点偏离主题,但它是相关且有趣的,确实获得了3个赞誉。保持它英寸
迈克尔·Chernick

2

作为生物仿生机器学习的研究人员,我坚信“没有模型是正确的,但有些模型是有用的”,事实上,模型和形式主义在作者讨论问题的最佳方式时都失败了,他们正在做什么。正在优化模型,即探索其参数空间并找到局部或希望的全局最优值。对于实际问题,这通常不是最佳选择。虽然模型的创建者通常使用正确的术语并公开所有假设,但是大多数用户会掩盖这些假设(通常不知道这些假设),并且使用不太精确的语言来表示“学习”,“优化”和“参数化”。

我认为模型的这种最佳参数化是人们在机器学习中,特别是在有监督的机器学习中的含义,尽管我不能说我已经听到很多“学习模型”的信息,但是它确实发生了,而人训练模型,计算机学习模型的参数。即使在无监督学习中,“学习”通常也只是模型的参数化,并且希望“学习模型”因此也是模型的最佳参数化(尽管通常可以用不同的搜索参数空间的方式找到不同的解决方案,即使它们可以被证明)以优化同一件事)。我确实宁愿使用“训练模型”

实际上,我的大部分研究都是通过发现更好的模型,或者在计算和认知/生物学/生态上更合理的模型方面来学习模型。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.