数学家机器学习入门


23

从某种意义上讲,这是我的math.stackexchange的交叉点,并且我觉得此网站可能会吸引广泛的受众。

我正在寻找关于机器学习的数学入门。特别是,可以找到的许多文献相对不准确,花费了很多页面而没有任何内容。

但是,从这些文献开始,我从安德鲁·伍(Andrew Ng),毕晓普(Bishop)关于模式识别的书以及斯莫拉(Smola)书中发现了Coursera课程。不幸的是,斯莫拉的书只是处于草稿状态。在Smola的书中甚至可以找到证明,这吸引了我。Bishop的书已经相当不错了,但是缺少一些严格的知识。

简而言之:我正在寻找一本类似Smola的书,即尽可能精确和严格,并使用数学背景(尽管简短的介绍当然可以)。

有什么建议吗?


1
将来请不要交叉张贴。
Momo 2015年

该问题似乎尚未解决-在“和”之后中断。
JW 2015年

抱歉,我的编辑以某种方式消失了。
Quickbeam2k1 2015年

1
您可能想解释为什么数学家想要学习机器学习(找到数据科学家的工作/从事研究等),这将帮助人们指出正确的方向
seanv507 2015年

1
对于数据科学,我认为您需要基本的统计知识(例如线性/逻辑回归),实验设计(例如Ab测试),以及对推荐系统技术的理解
seanv507 2015年

Answers:


9

对于您的描述,我强烈建议Mohri等人撰写的“机器学习基础”。这是一个本科生的文字,但它是针对真正的优秀本科生的。它可读性强,是我发现机器学习(pac和弱pac)的数学定义的唯一地方。仅仅因为这个原因值得阅读。我也有数学博士。我熟悉并且喜欢上面提到的许多书。我特别喜欢ESL广泛的技术和思想,但这是一本包含大量数学的统计书。


1
顺便说一句,有人告诉我沙皮尔(Schapire)在他的论文中证明弱PAC意味着PAC。他的证明相当于增强技术,因此这是一个理论问题如何导致非常实际的结果的很好的例子。
aginensky'3

谢谢您的发言。我想我将在后面Mohri博士的和沙立夫- Shwartz的书工作后ESL合作
Quickbeam2k1

12

我会推荐统计学习要素(免费PDF文件)。它具有足够的数学知识,并且很好地介绍了所有相关技术-以及对这些技术为何有效(以及何时无效)的一些见解。

另请参阅《统计学习入门》(这更实用-如何在R中进行操作)。它有一门进行统计学习的课程; 您可能会在YouTube上找到这些讲座(以及免费的PDF)。


3
这是一个非常好的建议。除此之外,我建议Yaser S. Abu-Mostafa的“从数据中学习”。它虽然理论性很强,但是却非常清楚地说明了主题,例如学习的可行性和VC维度。这些是在线提供的视频和幻灯片。
tiagotvv 2015年

我赞同Yaser S. Abu-Mostafa的“从数据中学习”的建议。这本书很短,但包含了很多有价值的信息。实际上,很多注意力都集中在学习的可行性和复杂性上。
Vladislavs Dovgalecs

7

您可能会喜欢Schölkopf和Smola的《与内核一起学习》。Schölkopf的大部分工作在数学上都很严格。

也就是说,您最好阅读研究论文而不是教科书。研究论文中包含完整的推导和收敛性证明,性能界限等,而教科书中通常没有包括。机器学习杂志(Journal of Machine Learning)是一个很好的起点,该杂志受到高度重视并且完全开放。我还建议会议的会议记录,例如ICMLNIPSCOLTIJCNN


感谢您对日记的提示。但是,我担心到目前为止,这些期刊对我来说太先进了。然而,这种势将成为未来的宝贵资源。
Quickbeam2k1 2015年

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.