您如何看待数据科学认证?


35

现在,我已经看到了两个数据的科学认证计划- 约翰·霍普金斯大学一个可在CourseraCloudera的一个

我确定那里还有其他人。

John Hopkins的一组类集中于R作为工具集,但涵盖了一系列主题:

  • R编程
  • 清理并获取数据
  • 数据分析
  • 可重复的研究
  • 统计推断
  • 回归模型
  • 机器学习
  • 开发数据产品
  • 看起来像基于项目的完成任务,类似于Cloudera的数据科学挑战赛

Cloudera程序表面上看起来很薄,但是可以回答两个重要的问题-“您是否知道工具”,“您可以在现实世界中应用这些工具”。他们的程序包括:

  • 数据科学导论
  • 数据科学基础考试
  • 数据科学挑战赛(现实世界中的数据科学项目场景)

我不是在寻找有关程序或质量比较的建议。

我对其他认证,它们涵盖的主题以及社区此时对DS认证的重视程度感到好奇。

编辑:这些都是很好的答案。我正在以投票方式选择正确的答案。


4
这太广泛了,主要是基于意见。请查看datascience.stackexchange.com/help/dont-ask
asheeshr 2014年

3
@AsheeshR-我们每天平均有2个问题,每个问题有2个答案。此时,重点应放在鼓励参与和增加兴趣上。
Steve Kallestad 2014年

10
以牺牲网站质量为代价进行合作并不是解决方案。订婚是短暂的。以后很难改变质量。
asheeshr 2014年

4
每天发布的自行车工作场所个人理财怀疑论者游戏开发都少于10个问题。自行车每天推出4个,因为它被认为是高品质的站点。
asheeshr 2014年

3
好吧...我想我现在必须宣布您为获胜者。:)
史蒂夫·卡列斯塔德

Answers:


13

我完成了前两门课程,并且我计划也做所有其他课程。如果您不了解R,那将是一个非常不错的程序。每周都有作业和测验。许多人发现某些课程非常困难。如果您没有任何编程经验(即使他们说这不是必需的),您将很难过。

请记住,这不是因为您可以驾驶汽车,而是因为您是F1飞行员;)


32

作为前分析经理和现任首席数据科学家,我对数据科学证书的需求非常持保留态度。数据科学家一词非常模糊,数据科学领域还处于起步阶段。证书意味着某种统一的标准,而这只是数据科学中所缺少的,但仍然非常荒凉。

尽管证书可能不会对您造成伤害,但我认为您最好花费时间来积累经验,以了解何时使用某种方法,以及对能够向非技术人员解释该方法的深入了解。


2
如果您当前的工作不是专注于数据科学而是专注于某个相关领域(在我的情况下是统计),则有时很难获得经验。我使用这些课程来获得一些知识并保持话题专注,而这在我的日常工作中是做不到的。
Christian Sauer 2014年

1
我完全同意,这些课程对于为您提供一个起点非常有价值,并提供了一些获得经验的结构。为了最大程度地利用Mooc,我建议举一个非常具体的例子,让我们说说逻辑回归,并使用不同的数据集进行实际操作,如果您使用的语言不是该课程所讲的语言,则可以加倍获得奖励。 。
neone4373

好主意。一般来说,统计网站缺少的是一个培训网站。例如,一组数据库,以及最终的目标和可能的结果。类似khancademy的东西,但功能更强大;)
Christian Sauer

11

您提到的认证计划实际上是入门级课程。就我个人而言,我认为这些证书仅显示人的持久性,并且仅对申请实习的人员有用,而对真正的数据科学工作不起作用。


我同意。该课程材料可以帮助您入门,但主要是入门课程。
Shagun Sodhani 2015年

10

我领导一家大型互联网公司的数据科学团队,已经筛选了数百个个人资料,并采访了我们在全球范围内的数十个团队。许多候选人已经通过了上述课程和计划,或获得了类似的证书。就我个人而言,我也参加了这些课程,有些很好,有些却令人失望,但没有一个能让您成为“数据科学家”。

总的来说,我同意这里的其他观点。来自Coursera或Cloudera的证书只是表明有兴趣,但不会动摇针头。还有很多需要考虑的地方,并且可以通过提供工作的完整存储库(例如github档案)以及与其他数据科学家建立网络来产生更大的影响。雇用数据科学资料的任何人总是会喜欢看您以前的工作和编码风格/能力。


8

正在进行多种认证,但是它们具有不同的重点领域和教学风格。

我更喜欢eDX上的Analytics Edge,而不是John Hopkins专业化,因为它更加密集且动手。约翰·霍普金斯(John Hopkins)专业化的期望是每周花费3-4小时,而每周在Analytics Edge上花费11-12小时。

从行业角度来看,我将这些认证视为兴趣的标志,而不是一个人拥有的知识水平。这些MOOC中的辍学太多。我对其他经验(例如参加Kaggle比赛)的重视程度远超过在MOOC上获得XYZ认证。


2
还有stats.SE,datascience.SE配置文件。您认为他们可以说很多有关相关知识的知识吗?
IharS 2014年

辍学与它有什么关系?大概,认证取决于完成课程,而不仅仅是注册…
庆典

许多人提到他们正在通过针对这些MOOC进行课程认证。您需要注意这一点。
Kunal 2014年

@Kunal这很有意义,但是您的答案从“认证”跳到了“辍学”(大概没有认证)。这里的关键正在进行中。这有点像注册为学生或拥有Kaggle帐户。这些都没有告诉我们您是否应该重视确实获得学位,完成课程或参加比赛的人。
晚会

6

不确定关于云时代的时代,但是我的一位朋友加入了约翰·霍普金斯大学,用他的话说,“让您入门非常精采”。很多人也推荐它。我计划在几周内加入。就严肃性而言,我认为这些认证不会帮助您找到工作,但它们肯定会帮助您学习。


4

@OP:最差的选择是通过投票选择答案。

您的问题成为人气竞赛。您应该寻求正确的答案,我怀疑您知道您的要求,知道您的要求。

要回答您的问题:
问:社区在这一点上对DS认证的重视程度如何。

答:参加这些课程的目的是什么?为了工作,学校,自我完善等?Coursera课程非常实用,您不会学到太多理论,它们是专为教室设置的。

尽管如此,Coursera类还是非常有用的。我想说,这相当于两年制硕士课程中一年制的统计研究生课程。

我还不确定它在行业中的知名度,因为您实际如何选择这门课程的问题?你花了多少时间?与课堂纸笔考试相比,在这些课程中获得A的要容易得多。因此,人与人之间存在巨大的质量差异。


问题的一部分是用来衡量社区是否重视认证。在某些地区,认证是绝对必要的。在其他情况下,认证根本不重要。在另一些公司中,特定公司的认证受到高度重视,而竞争性认证则没有。另一部分旨在了解现有认证在主题重点上的差异。数据科学是一个广义术语。认证通常更加集中。对于质量检查格式来说,这是一个不好的问题-它更多的是讨论,取决于意见。
Steve Kallestad 2014年

我注意到我以投票方式选择答案的目的是要明确地说所有答案都值得阅读。每个人都说好话,包括您在内。那些对这些事情感到疑惑的人不应将自己限制在最重要的一两个答案上。
Steve Kallestad 2014年

投票找到正确的答案是一个可怕的想法。这是错误的数学方法。你显然错了我的意思。
user13985

2

我认为,来自Coursera的认证的效果取决于个人和班级。要求说每周至少3-5个小时,如果您投入更多时间,并且材料的开放时间远远超过3-5个小时,那么这些课程和认证就相当于强大的知识库和该领域的经验。有科学要求的人。


2

我几乎完成了Coursera上的Johns Hopkins数据科学专业课程(即将毕业的一门课程和一个顶峰)。我只是给你它的优点和缺点,力图使其尽可能客观:

优点

  • 学习过程中的结构
  • 您将逐步建立投资组合

缺点

  • 不同的课程需要不同的背景。前几门课程不具备先前的知识。在概念课程中突然变得不容易理解。(统计推断,回归分析)
  • 由3位教授教授。我认为他们在潜在受众以及他们的能力/需求/兴趣方面不在同一页上。

2

成功获得想要的工作的最好方法是证明自己可以做到。

您提到的MOOC将为您提供基础知识,并足以让您开始解决自己的机器学习/数据科学问题。尝试一两次Kaggle比赛,这是提高技能的好方法,而体面的成绩也会吸引潜在的雇主。使用iPython Notebook之类的东西在Github上发布您的结果,这将使您的工作易于看到和判断。

尝试对其他公共数据集(例如UCI自行车共享数据集UCI糖尿病治疗数据集)进行分析,这些都是很有趣的尝试,它们表明您很热衷并且愿意发展自己的技能。



1

对学生的价值,包包。一个程序要花几百美元,一门课程要花一百美元。

我已经完成了MITx的一个系列。这是一门针对方法和工具的研究生调查课程,其对象是那些需要“详细了解”的人员。足够的基础,让我对应用所学知识感到很舒服。

有向无环图方法的独立HarvardX课程更像是Judea Pearl方法统计方面的研究生研讨会。否则,我要花很长时间才能知道。

HarvardX系列是研究生级别的新手训练营,旨在使新学生适应R工具集和应用程序。

BerkeleyX系列是一门大学调查课程,使用专门构建的Python类,该类几乎是特定领域的语言。

关于证书的价值,我只能报告说,我唯一的相关教育经验是地球物理学的硕士学位,在我的工作描述之外(高级银行律师),我有大约一年的带薪经验。

也许是由于获得证书的结果,我被拒绝从事至少两项我所知道的工作的“过高资格”。因此,我的建议是,如果您有证书,并且职位发布中出现“ Excel”一词,请不要提及。


1

edX的一些资源,这些资源可能来自该小组,这些资源来自哈佛,麻省理工学院,微软等,用于数据科学课程。

例如,我们有一个来自哈佛的专业证书课程,包括8个课程和此处的顶峰考试。

对于更高级的研究,我们这里有麻省理工学院的MicroMasters计划。

还有一名来自加州大学圣地亚哥分校在这里。有关数据科学的概述,我们提供了Microsoft 的程序。对于我们所有的程序,您都可以在这里查看

希望这可以帮助,

edX的Josh

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.