首先,这个词听起来很晦涩。
无论如何..我是一名软件程序员。我可以编码的语言之一是Python。说到数据,我可以使用SQL并可以进行数据收集。在阅读了很多文章之后,我到目前为止所得出的结论是Data Science擅长:
1-统计
2-代数
3-数据分析
4-可视化。
5-机器学习。
我到目前为止所知道的:
1- Python编程2- Python中的数据抓取
您能为我提供指导还是提出重新规划理论和实践的路线图?我给了自己大约8个月的时间。
首先,这个词听起来很晦涩。
无论如何..我是一名软件程序员。我可以编码的语言之一是Python。说到数据,我可以使用SQL并可以进行数据收集。在阅读了很多文章之后,我到目前为止所得出的结论是Data Science擅长:
1-统计
2-代数
3-数据分析
4-可视化。
5-机器学习。
我到目前为止所知道的:
1- Python编程2- Python中的数据抓取
您能为我提供指导还是提出重新规划理论和实践的路线图?我给了自己大约8个月的时间。
Answers:
少集中精力于获得技能,而更多地集中于获得经验。尝试实际解决一些问题并将您的工作发布在github上。在此过程中,您将学到更多,并且能够向雇主展示知识和经验,这比对所谓的主题或理论的深刻理解要有价值得多。
如今,数据科学领域是一个工作量很大的领域,因此我不确定您特别想从事哪种工作,但是假设机器学习是其中的一部分,那么kaggle.com是一个不错的起点。就目标而言,如果您能够使用pandas / numpy / scipy中的数据,在sci-kit中构建模型,并在seaborn,ggplot甚至matplotlib中制作一些漂亮的图形,那么您将不会有任何问题从技能的角度来看这份工作-特别是如果您有代码示例和示例来展示自己的能力。如果您陷入困境,那么stackexchange将提供答案,或者您可以发布问题,很快就会得到答案。一旦您从事谋生工作,您就会从指导您的高级团队成员那里学到更多东西。
祝你好运。
我喜欢Berkeley的数据科学课程,将为数据科学打下良好的基础和品味,之后转移到udacity和Coursera等更多资源。因此,如果您具有编程技能,那么您将需要数学和统计数据以及大量可视化工具。熟悉IPython也将非常有用,因为查看每个步骤(可视化)如何执行至关重要,而不是编写整个脚本并进行测试(anaconda易于安装和使用)。下面列出了课程:bcourses.berkeley.edu/courses/1267848/wiki,还有我从SAS找到的免费课程的统计:统计信息1:方差分析,回归和逻辑回归简介support.sas.com/edu/schedules.html ?ctry = us&id = 1979
从ML开始会建议:www.kaggle.com/c/titanic/details/getting-started-with-python
左侧也适用于使用Pivot表和R的Excel。DataCamp已发布了有关如何使用R的教程。完成此步骤后,kaggle会赢得更多的经验竞赛(最近针对旧金山犯罪分类发布了一个竞赛),最终来自www.dataschool.io的精彩视频教程
希望能帮助到你 ...
与真正的数据科学家戴维不同意的是,他是一名应用统计学家,他会编码并知道出于正确的原因如何使用机器学习算法。统计是所有数据科学的基础。它本身就是“蛋糕”。其他一切都只是锦上添花。
问题是您想成为什么样的数据科学家?您是否想成为该主题的大师(了解如何,为什么,何时以及何时不应用算法或技术)或使用Scipy并认为自己是数据科学家的Kaggle Script Kiddie?
1-统计
2-其他
如果您想成为一名具有真正知识的实践者,请从数学(微积分,概率+统计,线性代数)开始。在尝试通过编程实现所有步骤的每个步骤中,python都是不错的选择。当您取得良好的基础时,请使用真实的数据并解决问题
课程。线性代数-edx Laff或对矩阵Stat进行编码-edx stat 2x Barkley微积分-阅读...简单