机器学习食谱/参考卡/备忘单?


57

我发现诸如《概率统计手册》《 R数据挖掘参考卡》等资源非常有用。它们显然可以很好地用作参考,但也可以帮助我整理我对某个主题的想法并获得帮助。

问:是否存在类似这些资源的机器学习方法?

我正在想象一个针对每种ML方法的参考卡,其中包括:

  • 一般性质
  • 该方法行之有效
  • 当方法效果不佳时
  • 该方法从哪个方法推广到哪个其他方法。是否已被大部分取代?
  • 关于该方法的开创性论文
  • 与方法相关的未解决问题
  • 计算强度

我敢肯定,只需阅读一些教科书,就可以找到所有这些东西。将它们放在几页上真的很方便。


5
一个不错的目标,但“尽量减少一些教科书”?这20本书用于统计学习和数据挖掘 + mloss.org/software/rating甚至会开始压缩吗?
denis


2
(+1)对于chuzpa,如果存在这样的概述,我会为此付出代价。关键问题是,除了某些可以从算法本身获得的属性外,大多数此类属性或经验法则是通过经验(即应用)获得的。我敢肯定,经过艰苦奋战的应用研究人员或ML-framework-programmer / consultant可以写出类似的内容……但是现在还是现在?
steffen 2012年

@Denis:“ 20本书..”链接不起作用,您可以检查一下吗?
lmsasu 2012年

6
我不是机器学习专家,所以我会请他人发表答案,但我确实认为《统计学习的要素》被认为是该主题的不错文章,并且由该领域的一些知名人士撰写。我应该补充一点,这本书写得很高,听说的人推荐它的确有统计学博士学位。
2012年

Answers:


25

一些最好的和免费的资源是:

关于作者的问题,我还没有遇到“全页式”解决方案


谢尔盖(Sergey),理发师的书是否与Matlab有关?
denis

2
是的,只需看一下本书的链接即可:BRMLtool框可帮助读者了解数学模型如何转换为实际的MAT-LAB代码。
谢尔盖(Sergey)

31

如果您想学习机器学习,我强烈建议您参加由Andrew Ng教授教授的冬季免费在线机器学习课程

我在秋天做了上一本,所有学习材料都具有卓越的品质,并且适合实际应用,并且更容易用书来解决那些挣扎的问题。

通过直观的良好解释和最少的数学运算,它也可以算是很轻松的事情。


我刚完成这门课程,太棒了!另外,它为我提供了一个很好的开始,以了解有关机器学习的书籍。
B

1
我认为现在的链接是coursera.org/course/ml
n611x007

14

是的,你很好。克里斯托弗·毕晓普(Christopher Bishop)的“模式识别和机器学习”是一本非常出色的书,可以作为一般参考,您不会错。

大卫·巴伯(David Barber)的著作《贝叶斯推理与机器学习》是一本相当新的书,但也写得很好,也同样广泛。我认为这本书对于该领域的新手来说稍微合适一些。

我使用了Hastie等人的“统计学习的要素”。(Macro提到),虽然这本非常强的书,但我不推荐它作为第一本参考书;也许它将更好地为您提供更专业的主题的第二参考。在这方面,David MacKay的书《信息论,推理和学习算法》也可以做得很出色。


2
+1主教。清晰的开发,甚至细节的水平。虽然还不错,但我总是发现Hastie等人。有点断断续续。
2012年

1
+1-Hastie,Tibshirani和Friedman是我个人的最爱。
StasK 2012年

1
推荐我也是我个人最爱的Hastie,Tibshirani和Friedman也是+1。并感谢其他建议;我会给他们看书,因为我确实需要一本好书来推荐给非统计学家(或刚进入该领域的人员)。
内斯托尔

1
+1主教。实际上,它也是经典统计数据的绝佳来源,但经过更新且变相。
猜想2014年

10

由于共识似乎是这个问题不是重复的,因此我想与机器学习者初学者分享我的最爱:

我发现《编程集体智慧》对于初学者来说是最简单的书,因为作者Toby Segaran致力于使中位软件开发人员能够尽快掌握数据黑客的知识。

典型的章节:清楚地描述了数据问题,然后粗略地解释了算法的工作原理,最后展示了如何仅用几行代码就可以创建一些见解。

python的使用使您可以相当快速地了解所有内容(您完全不需要了解python,我以前也不知道)。不要以为这本书只专注于创建推荐系统。它还处理文本挖掘/垃圾邮件过滤/优化/聚类/验证等,因此,您可以对每个数据挖掘器的基本工具进行简洁的概述。


6

Wisten and Frank,《数据挖掘》,Elsevier 2005,是一本很好的自学书籍,因为本书附带了一个Java代码库(Weka),并且非常实用。我怀疑有比我最新的版本。


1
是的,这本书被称为“机器学习”,但出版商改名为“ Data Mining”,当时是基于数据挖掘的炒作,尽管如此,本书的主题是ML而不是DM(两者之间有两个相似之处,但是不同的领域!)。
clyfe 2011年

1
汤姆·米切尔(Tom Mitchell)的著作《机器学习》也很好。样式有点过时,但内容非常出色。
Dikran有袋动物2011年

是的,汤姆·米切尔(Tom Mitchell)的ML就像ML圣经一样,在领域上确实很全面!
clyfe 2011年


5

对于您的目的,“统计学习要素”将是一本好书。该书的第五版于2011年初出版,可从以下网址免费获得:http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf


2
这是一本数学重书,因此自学者可能很难遵循。
Atilla Ozgur,

您知道在Springer收费70美元时,如何在Trevor Hastie的个人页面上免费下载它吗?
Alfred M.

我不确定,但我想斯普林格要钱,而作者主要是想广泛宣传他们的书。这似乎与Springer将向您出售已发表文章的方式非常相似,而许多“工作论文版本”可在作者的网站上免费获得。
DanB

仅供参考,下载适用于第二版的第五次印刷。我喜欢egraph的脚注“我们相信上帝,所有其他人都带来了数据”,该脚注归因于戴明。脚注指出具有讽刺意味的是,找不到“数据”来确认戴明实际上是在说这句话。
HeatfanJohn 2012年

您应该提到R统计学习入门 -有点像他们的ESL -lite(如果ESL中的数学过于艰巨)。
史蒂夫·S



3

其他答案中提到的大多数书籍都非常好,您对它们中的任何一个都不会错。此外,我发现以下针对Python的备忘单scikit-learn非常有用。


2

我喜欢Duda,Hart和Stork的“模式分类”。这是经典文本的最新修订版,很好地解释了所有内容。不确定是否已对其进行更新以涵盖神经网络和SVM。Hastie,Tibshirani和Friedman的书讲述的是最好的书,但可能比您要寻找的书更具技术性,并且详尽而不是概述。


2

Microsoft Azure还提供了与Anton Tarasenko发布的scikit学习类似的备忘单。

Microsoft Azure机器学习算法备忘单

(来源:https : //docs.microsoft.com/zh-cn/azure/machine-learning/machine-learning-algorithm-cheat-sheet

他们伴随着一个通知:

该算法备忘单中提供的建议是大致的经验法则。有些可以弯曲,有些则可以公然违反。这是为了建议一个起点。(...)

Microsoft另外提供了一个介绍性文章,其中提供了更多详细信息。

请注意,这些材料集中于Microsoft Azure中实现的方法。


1

不要从统计学习要素入手。很好,但这是参考书,听起来并不像您要找的东西。我会从编程集体智能开始,因为它很容易阅读。


我不确定我会将ESL表征为参考文本。在我看来,这似乎更像是一个概述,也就是说,您将不会(几乎)不学习任何东西的细节。您将看到广泛的技术和总体主题。
红衣主教2012年

1

对于有关机器学习的第一本书,它很好地解释了原理,我强烈建议

Rogers和Girolami,《机器学习的第一门课程》(查普曼与霍尔/ CRC机器学习与模式识别),2011年。

一旦您掌握了原理,克里斯·毕晓普(Chris Bishop)的书或大卫·巴伯(David Barber)的书都为一本广度更大的书做出了不错的选择。




0

Max Kuhn在“ 应用预测建模 ”一书中提到了一个好的秘籍。书中有一个很好的汇总表,列出了几种ML学习模型。该表在附录A第549页中。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.