Questions tagged «careers»

对于统计学家,数据科学家等在职业生涯中必须获得成功的技能提出疑问。使用此标签询问问题时,请确保它具有普遍意义,而不是针对您的特定情况寻求建议。

15
什么是数据科学家?
最近从我的统计学博士课程毕业后,我在过去的几个月里开始寻找统计学领域的工作。我考虑的几乎每家公司都有一份工作职位,职位名称为“ 数据科学家 ”。实际上,看到统计科学家或统计学家职位的日子早已一去不复返了。曾经是一名数据科学家真的取代了统计学家吗?还是我想知道这些称谓的代名词? 好吧,大多数工作资格证明都像统计学家的头衔一样。大多数工作都希望获得统计学博士学位(),最需要的理解实验设计(),线性回归和方差分析(),广义线性模型()以及其他多元方法,例如PCA() ,以及统计计算环境(例如R或SAS )中的知识()。听起来数据科学家实际上只是统计学家的代号。✓ ✓ ✓ ✓ ✓✓✓\checkmark✓✓\checkmark✓✓\checkmark✓✓\checkmark✓✓\checkmark✓✓\checkmark 但是,每次面试时我都会问一个问题:“那么,您是否熟悉机器学习算法?” 通常,我发现自己不得不尝试回答有关大数据,高性能计算以及神经网络,CART,支持向量机,增强树,无监督模型等主题的问题。当然,我确信自己都是这些有关统计问题的内心深处,但是在每次面试结束时,我都忍不住对数据科学家的了解越来越少。 我是统计学家,但我是数据科学家吗?我致力于科学问题,所以我必须成为一名科学家!而且我还处理数据,所以我必须是一名数据科学家!根据Wikipedia的说法,大多数学者都会同意我的观点(https://en.wikipedia.org/wiki/Data_science等) 尽管在业务环境中使用了“数据科学”一词,但许多学者和新闻工作者认为数据科学和统计数据之间没有区别。 但是,如果我要在所有这些工作面试中担任数据科学家职位,为什么感觉他们从来没有问过我统计问题? 在上次面试之后,我确实希望任何优秀的科学家都能做得到,并且我寻找了解决该问题的数据(嘿,我毕竟是数据科学家)。但是,在经过无数次Google搜索之后,我终于回到了开始的感觉,好像我再次在努力解决数据科学家的定义。我不知道一个数据科学家是究竟是什么,因为有它的定义这么多,(http://blog.udacity.com/2014/11/data-science-job-skills.html,HTTP:// WWW -01.ibm.com/software/data/infosphere/data-scientist/),但似乎每个人都在告诉我我想成为一个: https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ http://mashable.com/2014/12/25/data-scientist/#jjgsyhcERZqL 等等...清单继续。 归根结底,我想出的是“什么是数据科学家”是一个很难回答的问题。哎呀,在Amstat有整整两个月的时间,他们花时间试图回答这个问题: http://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/ http://magazine.amstat.org/blog/2015/11/01/statnews2015/ 好了,现在,我必须成为一名性感的统计学家才能成为数据科学家,但希望经过交叉验证的社区可能能够阐明一些观点,并帮助我理解成为数据科学家的意义。并非所有的统计学家都是数据科学家吗? (编辑/更新) 我认为这可能使谈话变得有趣。我刚刚收到美国统计协会的一封电子邮件,内容涉及与Microsoft寻找数据科学家的职位。这里是链接:数据科学家职位。我认为这很有趣,因为该职位的角色影响了我们一直在谈论的许多特定特征,但是我认为其中许多特征需要非常严格的统计背景,并且与下面发布的许多答案相矛盾。万一链接失效,以下是微软在数据科学家中寻求的素质: 核心工作要求和技能: 使用Analytics的业务领域经验 必须具有多个相关业务领域的经验,需要运用批判性思维技能来使用大型现实业务数据集中的高级分析概念化复杂的业务问题及其解决方案 候选人必须能够独立运行分析项目,并帮助我们的内部客户了解调查结果,并将其转化为行动以使他们的业务受益。 预测建模 跨行业的预测建模经验 与客户进行业务问题定义和概念建模,以引起重要的关系并定义系统范围 统计/计量经济学 对连续和分类数据进行探索性数据分析 针对企业和消费者行为,生产成本,要素需求,离散选择以及其他需要的技术关系的结构模型方程的规范和估计 先进的统计技术可分析连续和分类数据 时间序列分析和预测模型的实现 处理多变量问题的知识和经验 评估模型正确性和进行诊断测试的能力 能够解释统计数据或经济模型 建立离散事件仿真和动态仿真模型的知识和经验 数据管理 熟悉使用T-SQL和分析进行数据转换以及将探索性数据分析技术应用于非常大的实际数据集 注意数据完整性,包括数据冗余,数据准确性,异常或极端值,数据交互和缺失值。 沟通与合作技巧 独立工作并能够与虚拟项目团队合作,该团队将研究创新的解决方案以解决业务难题 与合作伙伴合作,运用批判性思维技能,并推动端到端的分析项目 出色的口头和书面沟通能力 …

9
数学家希望获得等同于质量统计程度的知识
我知道人们喜欢关闭重复项,因此我不要求参考来开始学习统计信息(如此处)。 我拥有数学博士学位,但从未学过统计学。顶尖的BS统计学位获得等效知识的最短途径是什么,当我达到这一水平时如何衡量。 如果一本书的清单就足够了(假设我做练习可以说),那就太好了。是的,我希望解决问题是学习它的一个隐含部分,但我想尽可能快地实现快速跟踪。除非这是统计学专业人士通常会学到的内容,否则我不会寻求严格的治疗。

11
在没有博士学位的情况下从事数据挖掘工作
一段时间以来,我对数据挖掘和机器学习一直很感兴趣,部分原因是我在学校主修该领域,还因为我真的很兴奋,尝试解决需要更多思考而不只是编程的问题知识及其解决方案可以有多种形式。我没有研究人员/科学家背景,我来自计算机科学背景,重点是数据分析,我拥有硕士学位而不是博士学位。我目前有一个与数据分析相关的职位,即使这不是我正在做的工作的主要重点,但我至少对此有一定的了解。 前段时间我在几家公司工作时面试,并与一些招聘人员交谈,我发现一种常见的模式,人们似乎认为您需要拥有博士学位才​​能进行机器学习,即使我可能概括得太多了(有些公司并不是特别在意博士学位)。 虽然我认为在该领域拥有博士学位是件好事,但我认为这不是绝对必要的。我对大多数现实世界的机器学习算法有相当不错的了解,我自己(在学校或个人项目中)已经实现了大多数算法,并且在解决涉及机器学习/数据挖掘和统计的问题时感到非常自信。而且我有一些朋友具有相似的个人资料,他们似乎对此也非常了解,但同时也感到,如果您不是博士学位,那么一般而言,公司对于聘用数据挖掘人员会非常害羞。 我想获得一些反馈,您认为博士学位对于在这个领域非常专注是绝对必要的吗? (在将这个问题发布到这里之前,我有所犹豫,但是由于它似乎是meta上可以接受的主题,因此我决定将这个问题发布了我已经思考了一段时间的问题。)

18
统计面试题
我正在寻找一些统计信息(从可能性到概率),从最基本的到更高级的。答案不是必需的(尽管指向本网站上特定问题的链接会很好)。

3
关于统计学硕士课程的注意事项
这是研究生院的入学季节。我(和许多像我一样的学生)现在正试图决定选择哪个统计程序。 那些从事统计学工作的人建议我们考虑统计学专业的哪些方面? 学生是否有常见的陷阱或错误(也许就学校声誉而言)? 对于就业,我们应该集中精力于应用统计还是应用统计和理论统计的混合? 编辑:这是有关我的个人情况的一些其他信息:我现在考虑的所有程序都在美国。一些侧重于应用性更强的方面,并在“应用统计”中授予硕士学位,而其他人则具有更多的理论课程,并​​在“统计”中授予学位。我个人并不是在一个行业工作,而不是在另一个行业工作。我有一定的编程背景,并且比起基因组学或生物信息学行业,对技术行业的了解要好一些。但是,我主要是在寻找有有趣问题的职业。 编辑:试图使问题更普遍适用。



7
机器学习科学家的日常工作是什么?
我是德国大学的CS学硕士,现在写论文。如果要继续攻读博士学位或在该行业找到工作,我将在两个月内做出非常艰难的决定。 我做博士学位的原因: 我是一个非常好奇的人,我觉得我仍然缺乏太多知识。我想学很多东西,博士学位会为我提供帮助,因为我可以做更多的好课程并阅读大量论文,并成为数据挖掘和机器学习方面的专家。我喜欢数学,但是在本科(不好的大学)里并不擅长数学。现在在这个德国大学,我觉得我发展了很多很棒的数学技能,我想提高它,因为我真的很喜欢数学!(在本科生和一生中,我的数学真的很糟糕,但是现在我发现我的数学很好!) 我将处理具有智力挑战性的工作。 我需要说实话,我也不想看到其他人 比我更高学位的人。因此,如果我走进街上去见有博士学位的人,我不必说“哦,这个家伙比我聪明”。我宁愿站在另一边。;) 我不做博士学位的原因: 我在互联网上读过关于做博士学位还是不做博士学位的信息。我发现,在大多数情况下,拥有博士学位的人所做的工作与拥有硕士学位的人所做的工作相同。(这是计算机科学的普遍观察,而不是关于ML / DM)。 我可以开始职业生涯并在1或2年内赚很多钱,然后我可能可以创办自己的公司。 还不清楚的是: 我仍然不知道最终我的最终目标是什么。有一家著名的小公司吗?还是成为著名科学家?我仍然没有这个问题的答案。 为了帮助我做出决定,我想知道两件事: 拥有行业硕士学位的数据科学家/机器学习者的工作感觉如何?你做什么样的工作?尤其是当我以机器学习科学家的身份在亚马逊上阅读这些广告时,我总是想知道它们的作用。 与以前相同的问题,但有博士学位。您做的事情与大师不同吗? 我要应对具有挑战性的有趣问题吗?还是一些无聊的东西? 稍微说明一下:我见过一个拥有机器学习博士学位的人(在德国),并且在一家致力于推广机器学习软件的公司中工作。据我了解,他的大部分工作是训练人们使用方法和软件(决策树等)。 如果我能从一些著名的优秀公司中获得有关德国/瑞士的经验的答案,那就太好了。


3
在工作环境中进行正确的统计?
我不确定此问题所属的位置:交叉验证或工作场所。但是我的问题与统计模糊不清。 在我作为“数据科学实习生”工作期间出现了这个问题(或者我猜是问题)。我正在建立此线性回归模型并检查残差图。我看到明显的异方差迹象。我记得异方差会扭曲许多检验统计数据,例如置信区间和t检验。因此,根据我在大学中学到的知识,我使用了加权最小二乘。我的经理看到了这一点,并建议我不要这样做,因为“我使事情变得复杂”,这对我来说根本不是一个非常令人信服的理由。 另一个示例是“删除解释变量,因为其p值无关紧要”。确实,从逻辑角度来看,这种建议是没有意义的。据我了解,不重要的p值可能是由于不同的原因造成的:机会,使用错误的模型,违反假设等。 另一个例子是,我使用k倍交叉验证来评估我的模型。根据结果​​,仅比C V m o d e l 2好。但是我们对于模型1 确实有一个较低的R 2,其原因与拦截有关。但是,我的主管似乎更喜欢模型2,因为它具有更高的R 2。他的原因(例如R 2CVmodel1CVmodel1CV_{model 1}CVmodel2CVmodel2CV_{model 2}R2R2R^2R2R2R^2R2R2R^2 是鲁棒的,或者交叉验证是机器学习方法,而不是统计方法)似乎还不足以说服我改变主意。 作为刚大学毕业的人,我很困惑。我非常热衷于应用正确的统计信息来解决现实世界中的问题,但是我不知道下列哪一项是正确的: 我自己了解的统计信息是错误的,因此我只是在犯错误。 理论统计量与公司的构建模型之间存在巨大差异。尽管统计理论是正确的,但人们只是不遵循它。 管理器未正确使用统计信息。 2017年4月17日更新:我已决定攻读博士学位。在统计中。谢谢大家的答复。
20 careers 


5
数理统计的哪些领域可高度采用?
我即将完成统计学方面的荣誉,我真的想获得博士学位,因为我发现数学统计学非常有趣。我最想攻读博士学位的研究领域是随机过程和时间序列。 但是,我也想在获得博士学位后在私营部门从事职业。我想知道私人机构中最常使用哪些数学统计领域,以及哪些类型的工作? 显然,我不会因为可以就业而去做博士学位,但是我认为这绝对是我需要考虑的事情,因此需要一些建议。

2
自我学习能带给我多远?
我从未参加过官方或结构化的数据分析或机器学习课程(最近的在线产品除外),并且从阅读和尝试中学到了很多我所知道的知识。我知道我离找到工作很远。 我的问题不是哪个更好(像这个问题一样),而是我可以达到一个可以申请工作并且实际上有机会独自学习的水平吗?另外,是否可以在合理的时间范围内(可能是10年?我现在31岁了...)? 还是我必须找到一种参加某种大学/大学的方法?


8
统计员是做什么的?
当我告诉我的非统计学朋友时,我是攻读统计学博士学位的研究生,他们自然会说:“哦,你想当教授吗?”。我告诉他们,不,我实际上打算在工业上工作。然后他们回答:“做什么?”。对于这个问题,我没有找到好的答案。我想给他们提供统计学家正在研究的一系列有趣的问题,但是我的回答通常很混乱或过于技术化。我认为大多数人都以为我们表现出色,并计算均值和标准差。 对于这个简短而有趣的问题,有什么好的答案? 谢谢!(不确定这个问题有什么好的现有标签)
12 careers 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.