数据挖掘和人工智能算法的数学基础


12

您能否给我一些有关数据挖掘和人工智能算法的澄清?他们使用了什么数学基础?您能否以数学为起点,来理解这些类型的算法?


举一个例子,领导IBM DeepQA / Watson在Jeopardy上获胜的David Ferrucci说,他注定是一个混合系统:一个由20-25人组成的团队,历时4年,来自多个学科,包括NLP,计算语言学,游戏理论,随机性和优化以及其他学科。

数据挖掘中的十大算法对启发性和领先算法作了详尽的概述。恐怕您需要提供更多详细信息(哪些应用程序?什么级别的详细信息?)才能获得有用的答案。
chl 2012年

Answers:


5

在统计学家社区中,这听起来确实有些奇怪,但是我很确定,大多数机器学习算法都可以表述为功能最小化问题。那意味着这将被数学优化所覆盖。

另一件事是,您可能需要微积分线性代数才能了解什么是优化。为了解释您的结果,您最好具有概率理论统计学的背景。


这纯粹是一个统计学家社区,是否有一个更好的机器学习人员堆栈交换站点,我不确定是否有专门的堆栈交换站点?
image_doctor 2012年

1
我不知道特定的机器学习堆栈交换站点。但是在此您可以找到很多“机器学习”人员(例如我),因为统计数据和机器学习之间的联系非常紧密。
德米特里·拉普捷夫

1

这个问题可能涉及面很广,您应该对数据挖掘的用途多说一些!但是,数据挖掘本质上是统计数据,而我所见过的AI的许多使用也都是统计数据。因此,您需要的数学是用于统计的数学:1)微积分和实数分析2)概率3)线性代数!实际上,3)可能是最重要的,几乎无论您要做什么(包括1)和2)),您都将严重依赖线性代数。因此,一定要获得的不仅仅是概念,还有操作技能!

使用了更多的东西,但也许更专业。因此,在您解决了问题(并学会了1),2)和3))之前,给出更详细的建议是没有意义的


0

似乎是一个公平的问题,我应该学习什么数学作为机器学习的基础?
也许这是一个广泛的答案。就像ML来自许多学科一样。

其他人提出了线性代数,概率论,统计学,度量空间以及许多其他相关的建议。

也许可行的方法是列出一些最流行的ML算法,看看它们并填写您觉得不太熟悉的数学。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.