我是R
语言程序员。我也是一群被认为是数据科学家,但来自CS以外的学科的人。
在我作为数据科学家的角色中,这表现得很好,但是,由于我的职业生涯开始R
并且仅对其他脚本/网络语言有基本了解,所以我在两个关键领域感到不足:
- 缺乏扎实的编程理论知识。
- 缺乏技术人员在像更快和更广泛使用的语言有竞争力的水平的
C
,C++
并且Java
,它可以被利用以提高管道和大数据计算的速度以及创建其中可以更容易地发展成快速DS /数据产品后端脚本或独立应用程序。
解决方案当然很简单-继续学习编程,这是我通过注册某些类(当前为C编程)所做的事情。
但是,既然我现在开始解决上述问题#1和#2,我就C
C++
问自己“ 像数据科学这样的语言以及对于数据科学来说,这些语言的可行性如何? ”。
例如,我可以非常快速地移动数据并与用户进行很好的交互,但是高级回归,机器学习,文本挖掘和其他更高级的统计操作呢?
所以。可以C
完成这项工作-哪些工具可用于高级统计,ML,AI和其他数据科学领域?还是我必须放弃C
通过调用R
脚本或其他语言进行编程而获得的大多数效率?
迄今为止,用C,我发现最好的资源是一个叫库鲨鱼,这使C
/ C++
使用支持向量机,线性回归(未非线性等先进的回归就像多项概率等)以及其他的短名单的能力(很棒)统计功能。