我正在寻找一个用于scala的良好的开源库,用于数学和统计。希望像Apache Math或Colt之类的东西,但是在Scala中实现。
谁能指出我正确的方向?
我正在寻找一个用于scala的良好的开源库,用于数学和统计。希望像Apache Math或Colt之类的东西,但是在Scala中实现。
谁能指出我正确的方向?
Answers:
是的有一些:
ScalaLab项目旨在为Java虚拟机提供高效的科学编程环境。该脚本语言基于Scala编程语言,该语言经过高级科学操作员的增强,并具有提供类似于Matlab的工作风格的集成环境。
脚本代码非常快,接近Java(有时更慢,有时更快),并且通常比等效的Matlab .m脚本快!
用于Scala的高性能数字线性代数库,在矢量和矩阵上具有丰富的类似于Matlab的运算符;数值例程库;支持绘图。
FACTORIE是用于可部署概率建模的工具包,在Scala中作为软件库实现。它为用户提供了简洁的语言来创建关系因子图,估计参数和进行推理。
通过twitter进行图处理:
Cassovary从头开始设计,可有效处理数十亿条边的图形。它带有一些常见的节点和图形数据结构以及遍历算法。典型用法是进行大规模图形挖掘和分析。
在Twitter上,Cassovary形成了堆栈的最底层,我们用它来推动许多基于图形的功能,包括“ Who to Follow”和“ Similar to”。我们还将它用于Twitter搜索中的相关性以及确定用户将看到哪些“推荐产品”的算法。随着时间的推移,我们希望将某些产品功能中的更多非专有逻辑引入到Cassovary中。
Twitter的抽象代数库:
代码针对于构建聚合系统(通过Scalding或Storm)。它最初是作为Scalding的Matrix API的一部分开发的,其中矩阵的值是Monoids,Groups或Rings的元素。随后,很明显,该代码在Scalding和Twitter的其他项目中具有更广泛的应用。
!具有实验地位!
sb_probdsl使用scala的新定界延续支持提供简单的离散概率编程支持。
用于Scala的Markov Chain库
马尔可夫链表示随机过程,其中下一步骤的概率分布不仅仅取决于当前步骤,但不取决于先前的步骤。给该库一些训练数据,它将生成在统计上类似于它的新随机数据。
Signal / Collect是用于大规模图形处理的编程模型和框架。该模型具有足够的表现力,可以在图形上简洁地制定许多迭代和数据流算法,同时允许框架透明地并行处理。
包括统计和实用程序包。包含非常基本和众所周知的内容,例如means std ...
虽然它不是库,但可以帮助您处理概率。