我正在尝试整理一门自我指导的数学课程,为学习数据挖掘和机器学习做准备。这是通过在Coursera上开始Andrew Ng的机器学习课程而激发的,并认为在继续之前我需要提高自己的数学技能。我不久前从大学毕业,所以我的代数和统计学(特别是政治科学/心理学课程)很生疏。
主题中的答案是ML的全部必备知识吗?仅建议与机器学习直接相关的书籍或课程;我已经研究了其中的一些课程和书籍,但不完全知道要研究的数学主题(例如:数学地址的哪个领域派生出方程式以“最小化成本函数”?)。建议的另一主题(技能和课程工作需要成为数据分析师)仅提及分析数据所需的各种技能。《数学家统计学导论》线程不适用,因为我还没有数学学位。一个类似的线程,数学家希望获得等同于质量统计程度的知识 有一本令人难以置信的统计书籍清单,不过我还是想从一堆生锈的代数开始着手数学,然后再往上走。
那么,对于那些从事机器学习和数据挖掘工作的人来说,您认为数学的哪些领域对您的工作至关重要?您会建议以什么顺序为数据挖掘和机器学习做准备的数学主题?这是我到目前为止的清单和顺序:
- 代数
- 前微积分
- 结石
- 线性代数
- 可能性
- 统计信息(此处有许多不同的子字段,但不知道如何进行细分)
至于数据挖掘和机器学习,通过我目前的工作,我可以访问有关网站/应用程序活动,客户/订阅交易和房地产数据(静态和时间序列)的记录。我希望将数据挖掘和机器学习应用于这些数据集。
谢谢!
编辑:
为了后代的缘故,我想为CMU的Geoffrey Gordon / Alex Smola的机器学习入门课程分享一个有用的数学自我评估。