如何自学数据科学?[关闭]


16

我是一名自学成才的Web开发人员,并且对自学数据科学感兴趣,但是我不确定如何开始。特别是,我想知道:

  1. 数据科学有哪些领域?(例如,人工智能,机器学习,数据分析等)
  2. 人们可以推荐在线课程吗?
  3. 是否有可供我练习的项目(例如,开放数据集)。
  4. 我可以申请或完成认证吗?

Answers:


15

欢迎来到站点,马丁!这是一个相当广泛的问题,因此您可能会得到各种各样的答案。这是我的看法。

  1. 数据科学是一个跨学科领域,通常被认为将经典统计,机器学习和计算机科学相结合(同样,这取决于您询问的人,但是这里可能还包括商业智能以及可能的信息可视化或知识发现;例如,维基百科有关数据科学的文章)。优秀的数据科学家还熟练掌握了他们工作所在领域的特定于领域的特征。例如,从事医院记录分析的数据科学家如果具有生物医学信息学的背景,则效率会更高。
  2. 这里有很多选择,具体取决于您感兴趣的分析类型。Andrew Ng的Coursera课程是大多数人提到的第一个资源,这是正确的。如果您对机器学习感兴趣,那么这是一个很好的起点。如果您想深入研究所涉及的数学,那么Tibshirani的《统计学习的要素》是一本非常出色的书,但却相当先进。除了Ng的课程外,Coursera上还有许多在线课程,但是您应该根据您要关注的分析类型和/或计划工作的领域来选择它们。
  3. Kaggle。如果您想深入了解一些实际的分析问题,请从kaggle开始。不过,根据您的专业水平,可能更简单些。欧拉计划是解决一次性练习问题的好资源,我仍然将其用作热身工作。
  4. 同样,这可能取决于您希望从事的领域。但是,如果您完成了一系列与数据科学相关的课程,我知道Coursera将提供数据科学证书。这可能是一个不错的起点。

祝好运!如果您还有其他特定问题,请随时在评论中问我,我们将竭尽所能!


1
回到这个问题上,吴安德的路艰难。我应该提到我数学不强。我听说这另一门数据科学课程对于学习绳索比较容易。你怎么看?
马丁

5

我是一位自学成才的数据科学家,我会尽力向您解释如何进行。


数据科学有哪些领域?(例如,人工智能,机器学习,数据分析等)

数据科学是一个非常广泛的领域。它与数据科学有关。因此,任何使用数据进行决策的领域都属于这一领域。一些字段包括:

  • 人工智能
  • 模式识别与分析
  • 生物统计
  • 统计学习
  • 机器学习
  • 数据美学(或数据可视化)
  • 数据新闻学

人们可以推荐在线课程吗?

我已经回答了类似的问题。所以我在这里引用它:

Coursera的机器学习课程开始。它在向学生介绍机器学习领域方面做得非常好,并帮助您在概念上打下坚实的基础。

万一您觉得该课程的数学知识没那么精明,可以选择由同一位教授讲授的课程,并且比以前的课程精通数学。

现在,您将对机器学习的基本概念有了一个清晰的直觉。现在,参加本课程,可以说是Andrew Ng课程的后续课程或补充课程。

IAPR的此资源对许多ML概念(例如交叉验证,正则化等)进行了深入注释。

您也可以查看在 Quora上的博客中汇编的这些惊人的资源列表

现在,要深入研究神经网络和深度学习的高级概念,您可以使用这本免费书籍

最后,免费的电子书:《统计学习的要素》对于ML或统计学习的初学者来说是一本很棒的书。

除此以外,请检查Quora的数据科学参考资料库


是否有可供我练习的项目(例如,开放数据集)。

我已经开始使用印度的开放数据集进行项目。但是,我建议您在这里查看这个精彩的讨论,在完成这些项目之后,您可以从Kaggle开始。


我可以申请或完成认证吗?

我认为,没有任何数据科学认证。是的,那里有很多大数据认证,但是我认为它们对于新芽的数据科学家来说并不是真正有用的,因此,我建议您在对机器学习和数据技能足够有信心之前,不要追求它们。


1

我建议从Coursera的数据科学专业开始。约翰·霍普金斯大学的数据科学专业是历史最悠久的专业。我不推荐书籍和笑话。他们只是在一开始就使您感到困惑。请记住,编码是数据科学中最简单的部分,您必须学习很多东西。为了获得有关该领域的想法,此维恩图是一个好的开始。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.