机器学习需要学习什么?


9

从去年开始,我一直在研究各种主题,以了解一些机器学习最重要的论文,例如

S. Hochreiter和J. Schmidhuber。(1997)。短期记忆长。神经计算,9(8),1735-1780。

但是,由于我没有任何数学背景,因此我开始学习诸如

  • 结石
  • 多元微积分
  • 数学分析
  • 线性代数
  • 微分方程
  • 实数分析(测度理论)
  • 基本概率统计
  • 数理统计

现在,我不能说我已经严格地研究了这些主题,但是我知道上面的主题想要处理什么。问题是我现在不知道该做什么。机器学习用于解决许多问题的领域很多,我不知道如何正确地利用它们。

例如,强化学习现在是最流行的主题之一,成千上万的研究人员正在进行他们的研究,以突破维度的诅咒。但是,作为将来要在IT公司工作的员工,办公桌上的任务并不是我期望的。

拥有自己的专业知识在这些领域中工作重要吗?如果是这样,我现在必须学习哪些科目?

为了您的方便,我想进一步了解Markov过程和Markov决策过程。


1
我想说的是,如果您了解LSTM论文中的所有内容,那么您或多或少已经具备了从事ML事业的所有“先决条件”。当然,您会以自己的方式找到新概念(每个人都可以找到),但是您将能够应对它们(通过自己进行一些研究)。如果您了解LSTM论文,那么Markov流程和MDP并不是什么大问题。
nbro

Answers:


4

作为人工智能的硕士学位学生,我强烈建议您学习机器学习的一些基础知识。

为此,您可以自己尝试一些Kaggle竞赛来获得一本不错的书(《机器学习》,汤姆·米切尔,麦格劳·希尔,1997年),以了解理论和实践。

我建议使用Mitchell的书,因为他是该领域的专家,并且许多机器学习课程都使用他的书。您也可以在线关注他的视频讲座

在Kaggle上,您可以找到许多有用的教程(称为Notebook),以开始使用可用数据集。一些有关《泰坦尼克号挑战》的教程在这里


5

实际上,您不需要对这些主题进行严格的研究即可实现机器学习算法。在机器学习中,只需要严格地对待概率论。您可以在此处找到一系列非常好的概率论讲座:

概率概论-不确定性科学

另外,微积分的基础课程就足够了,对于基本的实现,您实际上不需要了解高级微积分,除非您想使用新的东西量身定制权重更新方案或神经网络。但是要了解微积分的知识,请查看可汗学院: 微积分

线性代数的一些基本思想就足够了,只是为了可视化事物并获得直觉。汗学院在这方面有很棒的课程,我建议您检查一下: 线性代数

因为对于编程语言,机器学习或神经网络最好在Python或R中实现,因为它们中的数据可视化和编程非常容易。

实施神经网络和机器学习的主要目的是练习,练习的次数越多,您就会获得更好的体验。您还将对自己在实践中所做的事情有一个直观的认识。仅阅读理论和理解概念对您没有帮助。您必须在现实生活中实施它。就书而言,您可以在这里查看我的答案:

已为该领域新手提供经验丰富的程序员的AI理论/工具/应用程序的专业资源?


3

我发现统计模型非常有帮助。但是,仅靠统计是不够的,您还需要在概率论上有非常扎实的背景。


1

首先学习python的基础知识。从贝叶定理开始,然后转到1)概率密度函数2)累积密度函数3)连续函数4)中心极限定理。


除此之外,您认为学习研究生水平的概率论以查看一些机器学习的高级论文是否重要?另外,假设我了解上述所有内容(我并不是故意不礼貌,但是老实说,我知道连续性和统一连续性,pdf,cdf,mgf等之间的区别是什么)认为学习马尔可夫过程以制作生产水平程序很重要吗?
Windforce's

1

首先,快速了解我。我是一名预科生,毕业于生物物理学学位。经过一番努力和明智的决策,我现在是一名AI / ML软件工程师,拥有计算机科学硕士学位(机器学习专业)。

拥有自己的专业知识在这些领域中工作重要吗?

是的,绝对,但不一定在专业背景下。您无需受雇为机器学习软件工程师,但需要显示出对该领域的熟练程度。对于您问题的第二部分,这是一个很好的选择。

如果是这样,我现在必须学习哪些科目?

他们不是您应该关注的主题。机器学习是许多不同领域的结合,在深入学习更全面的实践之前仅专注于一个领域并不是很有效。相反,教程和练习才是游戏的名称。

  • Youtube上的3Blue1Brown提供了很棒的教程,尤其是在神经网络上
  • 可汗学院在数学教程方面是天赐之物。我想说,线性代数和概率/统计是最好的起点。但是最终也使用了多元微积分和微分方程。
  • Udacity是一个很棒的教程网站,甚至提供“纳米学位”程序,以使您获得更多有关人工智能和机器学习的经验。如果您只想观看视频,则它是免费的。
  • OpenAIGym是练习强化学习的好地方
  • Kaggle提供了有关机器学习的出色教程,他们的竞赛提供了有监督/无监督学习的出色实践。

通过动手开发和实践补充您在理论和数学背景方面的发展,以获得最佳结果。您提到了对MDP的特别关注,Udacity教程和OpenAIGym都将通过它们很好地实践MDP。

如果您对硕士学位感兴趣,那么我不能推荐佐治亚理工学院的计算机科学在线硕士学位(OMSCS)。这是一次很棒的教育,并且(当我于2015年入学时)不需要GRE,仅需花费$ 8000.00


-1

1
是的,我可以告诉你为什么我拒绝这个答案。1)通过学习前提条件,我认为您不能在3个月内很好地学习机器学习。2)每个人在学习时都有自己的节奏,因此将学习限制在3个月之内不是一个好主意。3)您将人们与其他来源联系在一起,而没有解释原因。
nbro

我们不能成为专业人士,但是至少Nuance可以做一些并领导一些ML竞赛。如果我放置一个链接,我会在那儿提到您将从该链接中获得的收益。同样,每个人都有自己的学习进度,我也同意这一点,但是在这三个月中,您可能会弄脏您的手。考虑到自己没有什么都不知道,但他们只是想开始并在可以开始更深入的学习时获得信心,这是非常通用的答案。
Maheshwar Ligade

@nbro如果我同意你的观点,那么每个人都有自己的学习进度,那么至少很少有人可以利用这个答案
Maheshwar Ligade

此答案更适用于不适合研究人员和科学家的工程师
Maheshwar Ligade
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.