Answers:
最近,我对同一问题感兴趣,并意识到机器学习中对“模型”没有单一定义。它高度依赖于您正在咨询的资源,这些资源可能是特定软件程序的文档,其用户社区所采用的lang语,或者是已发表的学术论文中使用的定义,这些定义可能因期刊而异。此外,我必须学会记住,此类论文不仅是由机器学习专家撰写的,而且是由需要应用机器学习技术(例如成像,各种医学领域等)的其他学科的专家撰写的。 。他们中的许多人没有明确定义术语“模型”,该术语经常被宽松地使用。这只是“模型”的几个不同定义
•统计模型,尤其是与概率分布有关的统计数据。
•回归数据和相关统计数据。
•上文尼尔·斯莱特提到的数学模型。
•机器学习中使用的数据模型,例如所涉及的列,其数据类型,数据源和其他元数据。这特别棘手,因为与我列出的前三个不同,此定义完全没有数学意义。有关示例,请参阅SQL Server“挖掘模型”的所有文档,这些文档具有双重作用,可以进行机器学习。
•有时,以上所有定义都被扩展为包括建立在方程式和元数据之上的机器学习结构,例如神经网络的规范。在其他情况下,这些被视为单独的实体。
有时根据来源将以上所有内容混合并匹配在一起。我敢肯定,我没有列出“模型”的其他定义,这将使问题进一步复杂化。为了解决这种模棱两可的问题,我试图训练自己,使作者无论何时使用“模型”一词,都无法理解作者的意图。有时很容易根据作者所处的上下文或领域来确定,但是有时我必须先深入了解文章或文档,然后再加以弄清楚。我希望我能对此有更明确的定义,但这实际上是一个模糊的术语。永远不可能有一个简单的“一刀切”的答案。希望对您有所帮助。
我喜欢Tom Mitchell给出的机器学习定义。
据说计算机程序可以从经验 E中学习有关某类任务 T和绩效指标P的信息, 如果计算机对T中任务的绩效(由P衡量)随经验E的提高而有所提高。
因此,给定这个定义,我应该说,模型是完成某些T类后获得的经验。
摘自有关Amazon Machine Learning的文章
训练ML模型的过程涉及为ML算法(即学习算法)提供训练数据以供学习。 The term ML model refers to the model artifact that is created by the training process.
在机器学习中,模型是重心,一切都围绕模型旋转。尽管不同的人对模型有不同的定义。但是我认为,这是我们最好的定义模型的方法,“机器学习中的模型是试图拟合数据并学习预测未知数据的假设”。