Questions tagged «career»

8
为什么互联网公司在数据科学家工作中更喜欢Java / Python?
我在数据科学家的职位描述中多次看到要求Python / Java经验而无视R的情况。以下是我从我通过Linkedin申请的一家公司的首席数据科学家那里收到的一封个人电子邮件。 X,感谢您的联系和表达兴趣。您确实具有良好的分析技能。但是,由于我们是互联网/移动组织,所以我们所有的数据科学家都必须具备Java / Python方面的良好编程技能,并且我们所做的一切都是在线的。 尽管我尊重首席数据科学家的决定,但我无法清楚地了解Python可以完成R无法完成的任务。有人愿意详细说明吗?实际上,我很想学习Python / Java,请提供更多细节。 编辑:我在Quora上找到了一个有趣的讨论。 为什么Python是数据科学家的首选语言? Edit2:来自Udacity的有关机器学习的语言和库的博客

11
数据科学家会使用Excel吗?
我认为自己是一名熟练的数据科学家。像大多数(我认为)一样,我制作了第一张图表,并使用Excel在高中和大学中进行了第一次汇总。当我上大学,研究生院和大约7年的工作经验时,我很快就选择了我认为是更高级的工具,例如SQL,R,Python,Hadoop,LaTeX等。 我们正在面试一位数据科学家的职位,并且有一位候选人自称是“资深数据科学家”(如今这是一个非常时髦的名词),具有15年以上的经验。当被问到他偏爱的工具集是什么时,他回答说这是Excel。 我以此为依据,证明他没有履历所要求的那样经验丰富,但不确定。毕竟,仅因为它不是我的首选工具,并不意味着它不是其他人的工具。有经验的数据科学家会使用Excel吗?您可以假设主要使用Excel的人缺乏经验吗?
37 tools  career  excel 

1
为什么xgboost比sklearn GradientBoostingClassifier快得多?
我正在尝试通过50个具有100个数字特征的示例训练一个梯度提升模型。XGBClassifier我的机器43秒内把手500棵树,而GradientBoostingClassifier只处理10棵(!)以1分2秒:(我没有理会试图种植500棵树,因为它会需要几个小时。我使用的是相同的learning_rate,并max_depth设置, 见下文。 是什么使XGBoost如此之快?它是否使用了sklearn家伙不知道的用于梯度增强的新颖实现方式?还是“偷工减料”并种植浅树? ps我知道这个讨论:https : //www.kaggle.com/c/higgs-boson/forums/t/10335/xgboost-post-competition-survey,但是那里找不到答案... XGBClassifier(base_score=0.5, colsample_bylevel=1, colsample_bytree=1, gamma=0, learning_rate=0.05, max_delta_step=0, max_depth=10, min_child_weight=1, missing=None, n_estimators=500, nthread=-1, objective='binary:logistic', reg_alpha=0, reg_lambda=1, scale_pos_weight=1, seed=0, silent=True, subsample=1) GradientBoostingClassifier(init=None, learning_rate=0.05, loss='deviance', max_depth=10, max_features=None, max_leaf_nodes=None, min_samples_leaf=1, min_samples_split=2, min_weight_fraction_leaf=0.0, n_estimators=10, presort='auto', random_state=None, subsample=1.0, verbose=0, warm_start=False)
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
开始我作为数据科学家的职业,是否需要软件工程经验?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为Data Science Stack Exchange 的主题。 5年前关闭。 我是爱丁堡大学的理学硕士,专门研究机器学习和自然语言处理。我有一些实践课程侧重于数据挖掘,还有一些涉及机器学习,贝叶斯统计和图形模型的课程。我的背景是计算机科学学士学位。 我进行了一些软件工程,并且学习了基本概念,例如设计模式,但是我从未参与过大型软件开发项目。但是,我在MSc中有一个数据挖掘项目。我的问题是,如果我想以数据科学家的身份求职,应该先申请研究生数据科学家的职位,还是先获得研究生软件工程师的职位,也许是与数据科学相关的事情,例如大数据基础设施或机器学习软件开发? 我担心的是,我可能需要良好的数据科学软件工程技能,而且我不确定是否可以通过直接担任研究生数据科学家来获得这些技能。 此外,目前我喜欢Data Mining,但是如果将来我想将自己的职业转到软件工程该怎么办?如果我专门研究数据科学,可能会很难。 我尚未受雇,所以我的知识仍然有限。欢迎您提出任何澄清或建议,因为我即将完成理学硕士课程,我想在10月初开始申请研究生职位。

2
在没有特定主题知识的情况下,数据科学作为职业值得追求吗?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为Data Science Stack Exchange 的主题。 5年前关闭。 最近,我与某人进行了交谈,并提到了我对数据分析的兴趣以及我打算学习必要的技能和工具的人。他们向我建议,虽然学习工具和建立技能很棒,但除非我在特定领域具有专门知识,否则这样做毫无意义。 他们的基本结论是,我就像一个拥有大量工具的建筑商,可以建造一些木箱,并且可以建造更好的东西(客舱,橱柜等),但是如果没有特定领域的知识,我永远不会成为建筑商,人们会去找特定的产品。 有没有人找到这个或对此有什么投入?似乎确实如此,人们将不得不学习事物的数据科学方面,然后学习一个新的领域以变得专业化。

7
我是一名程序员,如何进入数据科学领域?
首先,这个词听起来很晦涩。 无论如何..我是一名软件程序员。我可以编码的语言之一是Python。说到数据,我可以使用SQL并可以进行数据收集。在阅读了很多文章之后,我到目前为止所得出的结论是Data Science擅长: 1-统计 2-代数 3-数据分析 4-可视化。 5-机器学习。 我到目前为止所知道的: 1- Python编程2- Python中的数据抓取 您能为我提供指导还是提出重新规划理论和实践的路线图?我给了自己大约8个月的时间。
13 beginner  career 

3
统计+计算机科学=数据科学?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为Data Science Stack Exchange 的主题。 5年前关闭。 我想成为一名数据科学家。我研究了应用统计(精算科学),所以我有很好的统计背景(回归,随机过程,时间序列,仅举几例)。但是现在,我将攻读智能系统领域的计算机科学硕士学位。 这是我的学习计划: 机器学习 先进的机器学习 数据挖掘 模糊逻辑 推荐系统 分布式数据系统 云计算 知识发现 商业情报 信息检索 文字挖掘 最后,以我所有的统计和计算机科学知识,我可以称自己为数据科学家吗?还是我错了? 感谢您的回答。

7
转行到大数据分析
我是35岁的IT专业人员,纯技术。我擅长编程,学习新技术,理解它们并实施。我在学校不喜欢数学,所以我在数学上的成绩不高。我对从事大数据分析事业非常感兴趣。尽管我不喜欢它,但我对分析而不是大数据技术(Hadoop等)更感兴趣。但是,当我环顾互联网时,我发现,分析能力强的人(数据科学家)主要是数学专业的毕业生,他们完成了PHds并听起来像聪明的生物,他们远远超出了我。有时我会害怕思考我的决定是否正确,因为要靠自己学习预先的统计数据非常困难,并且需要付出大量的努力和时间。 我想知道我的决定是否正确,还是应该把这份工作留给那些一生都在著名的大学学习并获得学位和博士学位的知识分子。
9 career 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.