Questions tagged «definitions»

4
数据科学与数据挖掘一样吗?
我敢肯定,本论坛将要讨论的数据科学具有几个同义词,或者至少是相关领域,用于分析大数据。 我的特定问题是关于数据挖掘的。几年前,我参加了数据挖掘的研究生班。数据科学与数据挖掘之间有什么区别,尤其是我需要进一步了解才能精通数据挖掘?

3
开始我作为数据科学家的职业,是否需要软件工程经验?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为Data Science Stack Exchange 的主题。 5年前关闭。 我是爱丁堡大学的理学硕士,专门研究机器学习和自然语言处理。我有一些实践课程侧重于数据挖掘,还有一些涉及机器学习,贝叶斯统计和图形模型的课程。我的背景是计算机科学学士学位。 我进行了一些软件工程,并且学习了基本概念,例如设计模式,但是我从未参与过大型软件开发项目。但是,我在MSc中有一个数据挖掘项目。我的问题是,如果我想以数据科学家的身份求职,应该先申请研究生数据科学家的职位,还是先获得研究生软件工程师的职位,也许是与数据科学相关的事情,例如大数据基础设施或机器学习软件开发? 我担心的是,我可能需要良好的数据科学软件工程技能,而且我不确定是否可以通过直接担任研究生数据科学家来获得这些技能。 此外,目前我喜欢Data Mining,但是如果将来我想将自己的职业转到软件工程该怎么办?如果我专门研究数据科学,可能会很难。 我尚未受雇,所以我的知识仍然有限。欢迎您提出任何澄清或建议,因为我即将完成理学硕士课程,我想在10月初开始申请研究生职位。

3
并行和分布式计算
并行计算和分布式计算之间的区别是什么?当涉及到可伸缩性和效率时,通常会看到在机器集群中处理计算的解决方案,有时将其称为并行处理或分布式处理。 从某种意义上讲,计算似乎总是并行的,因为有些事情是同时运行的。但是,分布式计算是否仅与使用一台以上的机器有关,还是存在区分这两种处理的其他特征?举例来说,计算是并行和分布式的,这是否多余?

3
面向数据科学的数据集/统计学硕士研究问题
我想探索“数据科学”。这个词对我来说似乎有点模糊,但是我希望它要求: 机器学习(而不是传统的统计); 一个足够大的数据集,您必须在集群上运行分析。 具有一定编程背景的统计学家可以访问哪些好的数据集和问题,以用于探索数据科学领域? 为了尽可能缩小范围,理想情况下,我希望链接到开放的,使用良好的数据集和示例问题。

3
最佳科学计算语言[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 5年前关闭。 似乎大多数语言都具有一定数量的科学计算库。 Python有 Scipy Rust 有 SciRust C++有几个包括ViennaCL和Armadillo Java具有Java Numerics和Colt其他几个 且不说像语言R和Julia明确的科学计算而设计。 有这么多种选择,您如何选择适合任务的最佳语言?另外,哪种语言的性能最高?Python并且R似乎在该领域具有最大的吸引力,但从逻辑上讲,编译语言似乎是一个更好的选择。会有什么表现胜过Fortran?此外编译语言往往有GPU加速,而解释性语言如R并Python没有。选择一种语言时应该考虑什么?哪些语言可以在效用和性能之间取得最佳平衡?还有我错过的具有重要科学计算资源的语言吗?
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.