机器学习入门数学书籍


14

我是一位计算机科学工程师,没有统计学或高级数学背景。

我正在学习Raschka和Mirjalili撰写的《Python机器学习》一书,但是当我试图理解机器学习的数学时,我无法理解一位朋友向我推荐的《统计学习的要素》这本书。

您知道用于机器学习的更简单的统计资料和数学书籍吗?如果不这样做,我应该怎么走?


我获得了统计学士学位,目前正在与Simplilearn一起学习数据科学在线硕士学位……要成为一名数据科学家,需要具有强大的统计学背景...因为机器学习中的大多数模型都是基于Maths和统计资料是在学位或更高水平的水平上教授的...我的建议是使用python阅读数据科学手册...在pchiita@gmail.com上给我发送电子邮件...以便我可以在Google云端硬盘上共享我的资料。 ..我有很多好书...愉快的学习....
Paul Chiita,

Answers:


8

尽管您需要一本书,但我还是建议您分别学习以下课程,以了解用于机器学习和数据科学中其他任务的统计信息。他们是免费的。

如果我想推荐一本书,我将推荐以下本书,该书在CC许可下是免费的。它有很好的例子,非常实用。此外,其中包含许多代码,可帮助您了解真实示例中的统计数据。

另外,以下链接可能会有所帮助:


谢谢回复。但是我更喜欢书,您有什么建议吗?
坦塔罗斯(Tantaros)

@Tantaros我更新了答案
媒体

添加了另一个链接..
Aditya

线性代数,微积分等呢?我从高中就没有练习过数学,所以即时通讯基本上是从零开始。但是,我已经编程了一段时间了。最近有2018/2019年急需学习语言的不同数学类型的列表吗?!谢谢
oldboy '18

在Coursera,有一个专业。我不记得它的确切名称,它有3门课程,正是您所需要的。这是毫升的数学运算。
媒体

2

线性代数入门https://math.mit.edu/~gs/linearalgebra/是一个很好的起点。确保您对概率论,线性代数和统计学都比较满意。可能不需要很深入的知识,但需要具备良好的知识。


香港专业教育学院在其他地方听说过,我不仅需要了解线性代数,而且还需要微积分?这是真的?我想知道的是,哪种类型的数学对于理解2018/2019年的机器学习数学绝对必不可少!任何帮助将不胜感激!!
老男孩

2

在成为Analytics(分析)硕士之前,我的学长建议我仔细阅读这两本书,以了解有关机器学习和统计的更多信息。

即:

  1. 使用SPSS / R发现统计信息-Andy Field
  2. R初学者和R for Everyone
  3. 预测分析-预测谁会点击,购买,说谎或死亡的能力
  4. 商业数据科学等等

如果您无法在线找到这些书,请告诉我将共享链接,因为我将这些书放在驱动器上。这些书以通俗易懂的例子帮助我理解了统计的基础。

如果您正在寻找一些在线课程,请告诉我可以为您推荐一些不错的课程(大多数都是免费的)。


1
大多数使用R或任何工具的书籍都无法解决他的问题。
dksahuji

1
实际上,我向他推荐这本书的原因是,示例非常好并且易​​于理解,并且偶然地在R中对这些示例进行了解释,但是R对每个人都有关于实现的解释等
Toros91,2016年

@ Toros91您能否提供链接?我想值得一提:)
媒体

1
@Media看了一下我的一个小收藏集(现在不维护)(1drv.ms/f/s!AhfWNelcf3iAgm5t4luUhUFal8II
Aditya

@Aditya sure :)
媒体

1

我不能从您的问题中看出您在数学方面的熟练程度或学习的目的。我假设您是计算机软件工程师,所以您熟悉代数,几何学,也许还有一些微积分。

我建议您通过阅读统计信息并理解概念(例如描述性,探索性数据分析,相关性,分布等)来开始学习。我发现您更喜欢书籍而不是视频,因此我会半途而遇,并为您提供一些在线书籍,以及您可以购买印刷版的一两本书。

首先,我将推荐宾夕法尼亚州立大学在线统计学研究生课程。您可以使用左侧的菜单探索他们的每门课程。选择课程后,向下滚动至该课程的网页,然后单击显示“在线课程注释”的链接。这些课程的课程笔记不仅仅是笔记,而且读起来像整本书。他们很有启发性。另外,如果您发现研究生课程中的某些内容过于先进并且需要“简单”的说明,还可以查看统计中的宾夕法尼亚州立大学在线本科课程课程

第二,回顾约翰·麦克唐纳(John H. McDonald)撰写的《生物统计手册》。不要让标题欺骗了你;本书是适用于任何领域的统计和数据分析的出色入门。

第三,回顾Gerard Dallal撰写的《统计小手册》。再说一次,不要让标题欺骗了你;本书是另一本让您了解一些重要的统计基础知识的瑰宝。

第四,查阅Allen Downey 的著作Think Stats。在线有一个较早版本的免费版本。您必须购买的最新版本。不过,这是值得的,特别是如果您使用Python。在本书中,作者教您使用Python进行统计和数据分析,以分析实际(玩具)数据集。这是一本非常好的书。

最后,请参阅 Joel Grus撰写的Scratch中Data Science。本书更侧重于数据分析(而不是统计基础知识),而更侧重于机器学习和建模。它使用Python(和Python数据科学堆栈)引导您完成对真实(玩具)数据集的分析和预测分析。另一本很棒的书。


1

请记住,尽管我拥有应用统计学硕士学位,但我将为您提供一个非常简单的答案:参加概率课程。

大多数现代ML编程框架都将大部分数学带出了数据科学领域。您实际上在大多数情况下都不需要它。但是,您将始终需要能够理解结果的能力,并且大多数结果都以概率表示。如果我是数据科学的新手,我会上一门关于概率的(简要)课程,试图理解比例和百分比的真正含义,然后我会真正非常了解一个框架(如Tensorflow)。如果可以的话,您可以编写一些非常有趣的算法,而不必对数学有所迷恋。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.