在没有博士学位的情况下从事数据挖掘工作


73

一段时间以来,我对数据挖掘机器学习一直很感兴趣,部分原因是我在学校主修该领域,还因为我真的很兴奋,尝试解决需要更多思考而不只是编程的问题知识及其解决方案可以有多种形式。我没有研究人员/科学家背景,我来自计算机科学背景,重点是数据分析,我拥有硕士学位而不是博士学位。我目前有一个与数据分析相关的职位,即使这不是我正在做的工作的主要重点,但我至少对此有一定的了解。

前段时间我在几家公司工作时面试,并与一些招聘人员交谈,我发现一种常见的模式,人们似乎认为您需要拥有博士学位才​​能进行机器学习,即使我可能概括得太多了(有些公司并不是特别在意博士学位)。

虽然我认为在该领域拥有博士学位是件好事,但我认为这不是绝对必要的。我对大多数现实世界的机器学习算法有相当不错的了解,我自己(在学校或个人项目中)已经实现了大多数算法,并且在解决涉及机器学习/数据挖掘和统计的问题时感到非常自信。而且我有一些朋友具有相似的个人资料,他们似乎对此也非常了解,但同时也感到,如果您不是博士学位,那么一般而言,公司对于聘用数据挖掘人员会非常害羞。

我想获得一些反馈,您认为博士学位对于在这个领域非常专注是绝对必要的吗?

(在将这个问题发布到这里之前,我有所犹豫,但是由于它似乎是meta上可以接受的主题,因此我决定将这个问题发布了我已经思考了一段时间的问题。)


1
这个站点上最近有几个非常相似的问题。您也可以看看它们。您的问题已得到很好的陈述,但最好是使其针对您的特定情况的关注程度降低一些,从而使其范围缩小。
主教

1
另外,您是什么意思,意味着您在学校主修数据挖掘和机器学习?我能想到的在北美大约只有一两所大学的,例如,在这样的程度可能存在。我可以想像很多MS程序,在这些程序中您可以将其作为学位的重点,但仍可能没有这样的称呼。
主教

感谢@cardinal的反馈(这是我的第一篇文章),我发现的唯一问题似乎有些不同,因为我真的想澄清一下我在最近的经历中似乎没有发现的Phd = no机器学习。
Charles Menguy

1
我拥有CS的硕士学位,但是我的专业是数据挖掘。我不是来自美国:)
Charles Menguy

3
只是以为我会把我的2美分扔进去,而没有给出答案。我从事数据挖掘和机器学习,并且大多是自学自学的(除了我与CS相关主题的学士学位)。学术ML主题与业务应用程序有很大不同,但是在每个方面都有所涉足。
2012年

Answers:


56

我相信实际上您结论的反面是正确的。在《一次性学术》中,给出了几个指示,说明博士学位持有者比硕士学位持有者在应用数学,数学和计算机科学领域的低工资溢价。在某种程度上,这是因为公司意识到,硕士学位持有者通常具有同等的理论深度,更好的编程技能,并且更加柔韧,可以接受针对其公司特定任务的培训。例如,要获得SVM的支持者来欣赏您公司依赖于决策树的基础架构并不容易。通常,当某人将大量时间用于特定的机器学习范例时,他们很难将其生产力推广到其他领域。

另一个问题是,如今,许多机器学习工作都与完成工作有关,而与撰写论文或开发新方法无关。您可以采用高风险的方法来开发新的数学工具,研究方法的VC维方面,其基本的复杂性理论等。但是最后,您可能会得到从业者不会关心的东西。

同时,看看像poselets的东西。基本上,新的数学都不会产生于体态。它完全不灵活,笨拙,并且缺乏任何数学上的复杂性。但是它可以很好地扩展到大型数据集,并且看起来在未来一段时间内,它将成为姿势识别(尤其是计算机视觉)的主要内容。这些研究人员做得很好,他们的工作值得称赞,但这并不是大多数人与机器学习博士学位相关的东西。

遇到这样的问题,您会得到很多不同的意见,因此请务必考虑所有这些意见。我目前是计算机视觉的博士学位学生,但是我决定早些离开硕士学位,然后我将在一家资产管理公司工作,从事自然语言机器学习,计算统计等工作。我也考虑过一些大型电视公司的基于广告的数据挖掘工作,以及一些机器人技术工作。在所有这些领域中,对于具有数学成熟度和解决多种编程语言问题的诀窍的人来说,都有很多工作。拥有硕士学位就可以了。而且,根据该《经济学人》的文章,与获得博士学位的人基本一样,您的收入将与之相同。如果您不在学术界工作,

正如彼得·泰尔(Peter Thiel)曾经说过的那样:“毕业学校就像按下生活闹钟上的贪睡按钮一样……”


6
当我第一次阅读《经济学人》的那篇文章时,它听起来像是一门研究不足,苦涩的家伙。一旦接近尾声并得知作者是博士的不幸接受者,我就不会感到惊讶。我对它的看法没有太大变化,因为从那时起我已经多次阅读它。通常,即使在学术问题上,《经济学人》也会做得更好。
主教

9
我认为这是一篇很棒的文章。这突显了如今研究生院的许多激励问题。另一篇有趣的文章是《作为博士后首席研究员的崛起》。我不确定您为什么认为这篇文章的研究不充分,您能否提供一些更具体的批评?我同意避免确认偏差很重要。但是,作为读者,只要消息来源是好的,我不太在乎作者是否处于确认模式。就我而言,关于学术界应该有更多的痛苦。
2012年

8
我对《经济学人》的文章有几项主要的批评,除了这样的事实,即当阅读一个所谓的客观分析文章时,从中渗出的情感不应该是我首先注意到的。可悲的是,这些字符不能容纳600个字符,尽管它们可能会发表不错的博客文章。我认为该作品的前提从一开始就是错误的。寻求获得经济利益博士学位的人已经误解了预期的目的。即便如此,工资溢价分析仍然存在致命缺陷,因为它不能说明大部分博士学位持有人仍然
红衣主教(

3
...进入学术界 而且,仅此效果,就会拖累任何工资溢价分析,尤其是在数学等领域。
主教2012年

4
另外,我绝对反对您的主张,即至少在应用科学领域,仍有很大一部分进入学术界。博士后,几乎没有我的同龄人留在学术界。他们为Microsoft,Google,nVidia,Facebook,金融公司等服务。等等。我们的研究生发展研讨会所强调的最大的事情之一是,获得学术职位的任期和不切实际的前景的能力正在下降。
2012年

47

免责声明:我有博士学位。并从事机器学习。话虽如此,我认为除了成为一名学者以外,您不需要博士学位。在任何领域工作 获得博士学位 帮助您发展某些研究技能,但是

  1. 对于大多数工作,您不需要那些研究技能。
  2. 您无需获得博士学位即可获得这些技能。学位。

金融时报》首席经济通讯员马丁·沃尔夫Martin Wolf)没有博士学位。(他拥有硕士学位),但是他的话语比大多数博士学位更具分量。毕业生。我认为要在任何领域(包括机器学习)取得成功,您都必须知道如何学习和自己思考透彻的知识。博士学位 可以帮助您练习这些技能,但这并不是目的。仅仅因为您没有博士学位而不愿意接受您采访的任何人可能都不值得为之工作。


向有博士学位的人征求意见非常有趣,我同意,博士一定会严谨,并且对于大多数研究型职位可以说是“加分”,我注意到,初创公司的想法很狭narrow尽管大型公司似乎更愿意聘请硕士学位来学习机器学习(同样,这取决于哪个公司...)。目前,我已经找到了一个不错的折衷方案,并且我希望通过在当前职位上获得一些实际经验,将自己的职业更多地引导到那条道路上。感谢您的宝贵建议。
Charles Menguy

2
@linker无法就启动问题达成共识。我有CS的硕士学位(虽然是ML的硕士论文),而我的第一个职位是一家创业公司。初创企业不应该在意职称,因为他们会定期寻找能够完成工作(并与公司中的其他人打成一片)的思想广泛的思想家,与此同时,我怀疑大型公司会遵循刻板的政策,以避免过多地承担责任。单个HR无人机(没有苦涩,这里只是幽默;))
steffen 2012年

1
当博士不推荐博士或常春藤毕业生不推荐常春藤的时候,我喜欢它。就像彼得·泰尔(Peter Thiel)建议不要上大学。那家伙从斯坦福大学获得法学博士学位:)
阿克萨卡(Aksakal)18-3-22

1
这实际上取决于您打算对Phd做什么。如果您的目标是学术界,那么这是必须的,但是在工业界,它的确不是一个大优点,除非您的目标是进行研究。只看成功的科技公司及其执行团队(如果有的话,包括Eng的CTO和SVP)。您在那儿找到几个STEM博士?它们存在,但很少,而且经常是创始人之一。拥有博士学位可能会为您打开一扇门,但是对于实际完成某件事,现实世界的经验和对基础知识(包括数学)的深入了解至关重要
user765195

19

免责声明:我没有CS博士学位,也没有从事机器学习的工作;我从其他知识和经验中总结。

我认为这里有几个很好的答案,但以我的诚实观点,它们还没有完全阐明主要问题。我会尝试这样做,但是要意识到我并没有在说完全不同的话。这里的主要问题涉及 技能发展与信号传递

关于技能开发,最终您希望(作为一名员工)能够完成工作,做好并迅速完成工作,而雇主则希望(或应该应该)有这样的人。因此,这里的问题是,经过几年的学术培训,您还能获得多少额外的技能开发?当然,您应该会有所收获,但要认识到,那些没有继续读研究生的人可能不会只是坐在自己的手上,直到毕业为止。因此,您正在比较一组经验(学术)与另一组经验(工作)。好一点取决于博士学位的质量和性质。课程,您的内在兴趣,您的自我指导以及您的第一份工作将提供什么样的机会和支持。

除了持续的学术训练对技能发展的影响之外,还有信号的影响和价值的问题(即在您的名字后附加“ Ph.D”)。该信号可以通过两种方式提供帮助:首先,它可以帮助您找到最初的工作,并且不应该忽视这一点-这非常重要。研究表明,那些必须在不适合自己的第一职位上开始工作的人,通常不会像开始从事一项良好工作的人那样做(在职业上平均而言)匹配他们的能力和兴趣。另一方面,共识似乎是,你的第一份工作之后,你的前途比受学历的影响要大得多。

信号的第二个方面与分析人员和分析使用者之间的关系有关。@EMS很好地在评论中指出了这一点。有很多小型咨询店,他们喜欢拥有博士学位来向潜在客户炫耀:在最初的会议上试图签定合同,在抬头的信纸上,在完成的产品展示中等等。博士总是在那儿。对此持怀疑态度很容易,但是我确实认为咨询公司和消费者有合法的价值(他们可能对这些问题不太了解,可以使用证书来帮助他们选择对他们有好处的公司) 。在幕后,一些工作可能会被提供给资格证书较少的有能力的人,但他们想要博士学位。前端,并在交付之前签收工作产品。如果他们试图吸引资本并想让投资者放心,我会看到初创公司发生了类似的事情。


5
(+1)我认为这个答案越来越接近问题的症结所在。实际上,OP中有两个问题,一个被提出(至少在我看来是这样)。第一个是(1)没有博士学位的人可以在数据挖掘和/或机器学习中在工业上做有意义的工作吗?答案无疑是肯定的。第二个问题是(2)能否获得一个在该领域经验有限且没有博士学位的职位(并且很难做到这一点)?即使第二个可能更易于量化,但它似乎有更多的灰色区域。
主教

3
此外,罗宾·汉森写了一些好东西在这个信令和凭据近日方面,至少WRT咨询。
2012年

14

我同意这里所说的大多数,但是我想介绍一些在申请金融工作时出现的实际问题。通常,您会看到广告说明必须申请统计学或数学博士学位才​​能申请特定的交易或定量的开发人员职位。我知道有一些特殊原因。介意,我并不是说这是对的,但实际上是这样:

  • 这份工作有很多申请人,尤其是对于最知名的公司而言,雇主不可能为每个候选人分配足够的时间。根据学术背景筛选应用程序会将人口规模缩小到更易于管理的数量。是的,会有遗漏。是的,这不是找到有生产能力的人的最佳方法。但平均而言,您正在寻找的是专业人士,他们花了多年的时间来学习这项技术。他们至少应具有超越复杂研究项目的纪律。

  • 团队和公司将获得大量博士学位,以向投资者和客户展示。这将给公司带来“恶意”知识的印象,并有益于公司的声誉。公司的无形估值可能会上升。普通投资者将更有信心将资金提供给这样一支知识渊博的科学家团队。您可以对MBA提出类似的观点。

  • 最后,有时公司政策规定,较高的学业成绩应具有优先的职业道路和报酬。我相信这不仅适用于金融业,而且适用于不同行业的大多数公司。很难看出约翰拥有计算机科学理学士学位以管理数学博士学位。


14

免责声明:我是一名招聘人员,自1982年以来一直工作,因此我对您的问题非常了解。让我以这种方式分解它。您的简历是一种筛选工具。公司收到大量的简历,因此在阅读简历时会想到一个问题:“我为什么不想和这个人说话?” 这样一来,他们就减少了几位最有可能满足其需求的候选人。因此,如果您正在接受面试,而您的简历没有显示博士学位,那么这里还有其他事情发生。我说这是因为,就像简历是放映装置一样,面试也是放映装置。一旦他们邀请您参加面试,他们就会得出结论,您有足够的“纸上”来完成这项工作。因此,当您在面试中行走时,唯一的问题是 我真的在问:“我为什么要雇用你?” 他们雇用的人将是那些能够最好地满足公司需求的人。

作为招聘人员,我的建议是在面试过程中提出一些问题以确定他们的更深层次需求。相信我,职位描述很少与事实相像,因此您将需要探究他们的热门按钮,然后直接出售这些问题。不要让面试感觉像是在审问,等待结局提出问题。您会大跌眼镜,最终被告知“您没有博士学位”。要有礼貌,但要表现出您愿意帮助他们解决问题的意愿。

我最喜欢的问题是:“ 您所担任的最佳人选的特征是什么?” 每个人都有一个梦dream以求的团队,因此弄清楚他们认为要取得这个角色所必需的哪些特征非常重要。请记住,这不是有关经验,背景或学位的问题。瞧,我总能找到拥有大量经验的中等水平的博士,所以这不是圣杯。公司一直认为这是最好的,因为IMO他们不知道其他方式来撰写职位描述以捕捉所需人员的本质。


4
欢迎使用该站点@GailPalubiak。请不要用您的个人信息签名您的帖子。请注意,您的头像和指向用户页面的链接会自动添加到您的所有帖子中。您可以在此处发布该信息。由于您是这里的新手,您可能需要阅读我们的FAQ,其中讨论了此类主题。
gung

14

我的2分钱:不,我不这么认为。博士学位本身并没有赋予人们更好的数据挖掘或ML能力。以kaggle自己的Jeremy Howard为例。我什至可以说,博士学位没有说明任何资格,因为程序质量存在很大差异。博士学位唯一能证明的是持有人具有很高的挫折承受能力。

底线:如果您对该领域感兴趣,知识渊博,富有创造力且努力工作,为什么需要博士学位?应该算的是您,而不是头衔。


2
我完全同意,但是我印象深刻,公司/招聘人员似乎在反过来思考。即使是我以前的工作,当我讨论要对某些问题进行数据挖掘时,我也被告知我是工程师而不是数据科学家,因此,最好还是专注于我的领域。
Charles Menguy

3
说得好。请参阅我的答案以获取一些支持细节。该领域的博士学位不太相关,如果一家公司认为合适,那么您可能不想在该公司工作。彼得·泰尔(Peter Thiel)曾经说过:“毕业学校就像敲打生活闹钟上的贪睡按钮一样……”
2012年

6

一份工作是否需要博士学位取决于工作水平和对雇主和/或其客户的看法。我认为没有一门学科需要博士学位。当然,可以学习数据挖掘,并且员工无需博士学位即可从事生产性工作。与以前的教育相比,这更多地取决于人,他或她的快速学习和适应能力以及能够理解文学的能力。对于不断发展的数据挖掘尤其如此。因此,随着时间的流逝,即使是拥有博士学位的数据挖掘者也将有更多的学习机会。


4
(+1)一个需要博士学位的学科是大学教授。(当然也有例外,但很少。)
胡伯

2
从统计学上讲,这也是一种不太可能的职业,相对于研究生认为他们将成为终身教授的普遍信念,大多数研究生应该轻视它,或者至少轻量化它。过去15年来,在美国,研究一所大学的教学环境(除非您满足于兼职/博士后),已经发生了很大变化。
2012年

4

我拥有应用统计硕士学位,并在欧洲担任数据挖掘人员。当我来到英国时,甚至没有人听说过数据挖掘,更不用说学习这样的学位了。现在是司空见惯的事情,老板们觉得博士学位对于这项工作是必要的。但是,对于这项工作而言,重要的是统计知识和建模方面。以我的经验,大多数IT人员都不了解统计信息,因此无法很好地完成工作。我开始教学,现在报名参加应用统计博士学位,以使这些雇主满意。在1980年代,我的硕士学位水平很高时,我知道的知识可能比大多数博士毕业生要多。我认为要成为一名出色的数据挖掘者,必须具备统计学背景。


4

这完全取决于手头的工作。根据我的经验(我有博士学位),有3种工作。首先,正如已经说过的那样,如今大多数行业工作都面向应用机器学习,即,将现有ML算法的应用调整应用于所讨论的特定领域问题。这些是迄今为止最常见的ML职位,并且硕士学位足以胜任此类工作。恰好在公司或大学,机构的研究部门中的少数工作正在针对特定领域的问题进行应用-调整-创建ML工作。通过使用新数学研究现有方法来创建新方法的经验通常会花费一些时间,而这些经验通常是在博士学位期间获得的,因为新的理论结果应该足够有力,以得到同行的认可(出版物)。最后,可能是最困难,风险最高和最不常见的工作类型,是研究型大学所从事的纯粹理论性工作,重点是完全提出一种新算法,或者更好地理解现有算法的数学特性(还必须足以被发布)。这也是通常获得博士学位的经验。博士生在接受培训时可能会接触过所有三种类型的工作(这完全是由于该计划的时间长,而且没有像实际工作那样的即时产品截止日期这一事实),而MS学生通常对第一份工作进行良好的培训,并且可能只接触过第二种和第三种工作。


当您说“工作”时,您是指“定期工作”还是“一项任务或一件工作”?您似乎在这两种含义之间来回切换,这使您的答案有些混乱。
变形虫2015年

两者之间有区别吗?真正地问..
风暴追赶者2015年

2

我认为任何机器学习职位都不需要博士。一个好的主人和一个好奇心强的数学好奇心是他们所需要的。博士会将您的方法偏向于您的专业化,这是不可取的。我从事核心机器学习算法的研究,并按照自己的方式对大多数算法进行编码。而且我见过很多博士生有错误的心态。博士主要受纯理论问题的驱使,而行业中的重点是快速解决问题


2

看不起博士培训的人或者根本不知道博士意味着什么,或者只是故意发表不真实的评论;大多数硕士培训无论如何都不能与博士学位培训相提并论。博士学位训练的强度和严密性要求不可思议的奉献精神,自律,承受巨大压力的学习能力以及扎实的技能.........博士学位的头衔已经证明了所有这些,美国的常规硕士学位并非同一人水平。。。


6
我认为这里没有人“看不起博士培训”。我们大多数人都拥有博士学位。我们中的许多人都是在必须博士学位的学术环境中工作。这里的一些答复(例如,我自己的答复)只是在意识到可能有些没有证书的人具有技能,而这些人也可以找到工作。我有一个前学士学位学生(没有硕士学位),他是一家咨询公司的数据科学家。
gung
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.