我是一位计算机科学工程师,没有统计学或高级数学背景。
我正在学习Raschka和Mirjalili撰写的《Python机器学习》一书,但是当我试图理解机器学习的数学时,我无法理解一位朋友向我推荐的《统计学习的要素》这本书。
您知道用于机器学习的更简单的统计资料和数学书籍吗?如果不这样做,我应该怎么走?
我是一位计算机科学工程师,没有统计学或高级数学背景。
我正在学习Raschka和Mirjalili撰写的《Python机器学习》一书,但是当我试图理解机器学习的数学时,我无法理解一位朋友向我推荐的《统计学习的要素》这本书。
您知道用于机器学习的更简单的统计资料和数学书籍吗?如果不这样做,我应该怎么走?
Answers:
尽管您需要一本书,但我还是建议您分别学习以下课程,以了解用于机器学习和数据科学中其他任务的统计信息。他们是免费的。
如果我想推荐一本书,我将推荐以下本书,该书在CC许可下是免费的。它有很好的例子,非常实用。此外,其中包含许多代码,可帮助您了解真实示例中的统计数据。
另外,以下链接可能会有所帮助:
线性代数入门https://math.mit.edu/~gs/linearalgebra/是一个很好的起点。确保您对概率论,线性代数和统计学都比较满意。可能不需要很深入的知识,但需要具备良好的知识。
在成为Analytics(分析)硕士之前,我的学长建议我仔细阅读这两本书,以了解有关机器学习和统计的更多信息。
即:
如果您无法在线找到这些书,请告诉我将共享链接,因为我将这些书放在驱动器上。这些书以通俗易懂的例子帮助我理解了统计的基础。
如果您正在寻找一些在线课程,请告诉我可以为您推荐一些不错的课程(大多数都是免费的)。
我不能从您的问题中看出您在数学方面的熟练程度或学习的目的。我假设您是计算机软件工程师,所以您熟悉代数,几何学,也许还有一些微积分。
我建议您通过阅读统计信息并理解概念(例如描述性,探索性数据分析,相关性,分布等)来开始学习。我发现您更喜欢书籍而不是视频,因此我会半途而遇,并为您提供一些在线书籍,以及您可以购买印刷版的一两本书。
首先,我将推荐宾夕法尼亚州立大学在线统计学研究生课程。您可以使用左侧的菜单探索他们的每门课程。选择课程后,向下滚动至该课程的网页,然后单击显示“在线课程注释”的链接。这些课程的课程笔记不仅仅是笔记,而且读起来像整本书。他们很有启发性。另外,如果您发现研究生课程中的某些内容过于先进并且需要“简单”的说明,还可以查看统计中的宾夕法尼亚州立大学在线本科课程课程。
第二,回顾约翰·麦克唐纳(John H. McDonald)撰写的《生物统计手册》。不要让标题欺骗了你;本书是适用于任何领域的统计和数据分析的出色入门。
第三,回顾Gerard Dallal撰写的《统计小手册》。再说一次,不要让标题欺骗了你;本书是另一本让您了解一些重要的统计基础知识的瑰宝。
第四,查阅Allen Downey 的著作Think Stats。在线有一个较早版本的免费版本。您必须购买的最新版本。不过,这是值得的,特别是如果您使用Python。在本书中,作者教您使用Python进行统计和数据分析,以分析实际(玩具)数据集。这是一本非常好的书。
最后,请参阅 Joel Grus撰写的Scratch中的Data Science。本书更侧重于数据分析(而不是统计基础知识),而更侧重于机器学习和建模。它使用Python(和Python数据科学堆栈)引导您完成对真实(玩具)数据集的分析和预测分析。另一本很棒的书。
请记住,尽管我拥有应用统计学硕士学位,但我将为您提供一个非常简单的答案:参加概率课程。
大多数现代ML编程框架都将大部分数学带出了数据科学领域。您实际上在大多数情况下都不需要它。但是,您将始终需要能够理解结果的能力,并且大多数结果都以概率表示。如果我是数据科学的新手,我会上一门关于概率的(简要)课程,试图理解比例和百分比的真正含义,然后我会真正非常了解一个框架(如Tensorflow)。如果可以的话,您可以编写一些非常有趣的算法,而不必对数学有所迷恋。