研究生统计课程提供的用于统计的开源Java库


15

我正在应用统计专业的研究生课程中学习,该课程使用以下教科书(以使您了解所涵盖的材料的水平):统计概念和方法,由GK Bhattacharyya和RA Johnson撰写。

教授要求我们对家庭作业使用SAS。

我的问题是:是否有一个Java库可以代替SAS用于此类类中常见的问题。

我目前正在尝试使用Apache Math Commons,尽管该库给我留下了深刻的印象(它的易用性和易理解性),但它似乎甚至缺少一些简单的东西,例如绘制直方图的能力(将其与图表库结合的想法) )。

我看过柯尔特,但最初的兴趣很快就消失了。

我们将不胜感激-我已经在Stackoverflow上查看了类似的问题,但没有发现任何令人信服的内容。

注意:我知道R,SciPy和Octave以及对它们进行调用的Java库-我正在寻找Java本机库或一组库,它们可以一起提供我要寻找的功能。

注意:此类课程中涉及的主题通常包括:单样本和两样本检验以及均值和中位数的置信区间,描述性统计量,拟合优度检验,单向和双向方差分析,同时推断,检验方差,回归分析和分类数据分析。


2
你考虑过R吗?
RioRaider12年

嗨,感谢您的来信,我正在寻找一个几乎完全使用Java的库。因此,我知道可以调用它们的R,SciPy和Octave以及Java库-我将编辑问题以反映这一点。谢谢。
user1172468 2012年

您提到“我知道R,SciPy和Octave以及对它们进行调用的Java库”。您能否告诉我,您将如何调用使用Java在“ R统计软件”中编写的代码?
阿曼·查瓦拉

5
为什么要使用Java库进行基本统计测试?
Underminer 2014年

3
@Underminer在这里提出正确的问题。用Java进行统计就像用锤子钉螺丝一样。有了足够的决心和野蛮力量,您当然可以将螺丝固定到位,但方法不是非常优雅或有效的。最终可能会导致螺钉损坏和手指疼痛。
马克·克莱森

Answers:


10

当我被迫使用Java进行基本统计时,Apache Commons Math是必经之路。对于绘图,我使用并推荐JFreeChart。后者广泛传播,因此stackoverflow甚至为其填充了一个标签

编辑

如果有人在寻找套房,那么也许可以选择“ 演绎者”。GUI基于JGR,同时统计部分在R中调用。它似乎可以通过R和java进行扩展。例如,可以跳过对Rengine的调用,而改为调用引用的Java库。但是我承认,我还没有尝试过。

据我所知,OP是最优的,如Rapidminer for Statistics,因为Rapidminer是一个纯Java框架,支持GUI访问(包括可视化),用作库和自定义插件开发。据我所知,还没有类似的统计数据。我不建议将 Rapidminer 用于该特定任务,因为据我所知,它仅包含最基本的统计测试。可视化功能最近得到了扩展,但是我无法估计它们现在的可定制性。


嗨,这就是我正在尝试做的,希望有一个更全面的套件。
user1172468 2012年

@ user1172468我已经更新了我的答案
steffen 2012年

4

查阅Suan Shu:NUMERICMethod.com。通常它不是免费的,但是可以免费用于学术用途。


这并不是OP的问题的真正答案。这更多是评论。您介意将其扩展为更多答案吗?或者,我们可以将其转换为您的评论。
gung-恢复莫妮卡

也许您可以解释为什么它不是答案。他正在寻找一个Java库,我为他指出了一个具有他所寻找的大多数功能的库。
user765195 2014年

没错,这种情况比标准情况更加模棱两可。尽管如此,这实际上是仅链接的答案。SE将这些内容视为评论而非答案。您具有足够的声誉,可以提供此评论。因为仅链接在这里是一个答案,并且因为它具有投票权,所以我没有将其标记为转换为评论,但是如果可以添加一点,可能会很好。如果您不能这样做,并且选择不对其发表评论,那么我尊重您的决定,这就是为什么我只给您留下一个笔记。
gung-恢复莫妮卡

它似乎不是免费用于学术用途。
kosmos

不幸的是,不再明显,但学生版似乎仍可以100美元购买。
765195

3

类似于史蒂芬的建议对RapidMiner,您可能需要考虑Weka。它可能比您希望的更适合于机器学习。它有很多算法可以执行诸如聚类,分类和回归之类的任务。Weka有一个GUI,但是它也可以用作软件库。我已经在GUI中看到了直方图,但是我不确定是否很容易在库中重用它们。


嗨,谢谢您的回答,我当时真的是在考虑Grad Statistics课程所涵盖的材料:主题包括一样本和二样本检验以及均值和中位数的置信区间,描述性统计量,拟合优度检验,一和二方差分析,同时推断,检验方差,回归分析和分类数据分析。
user1172468 2012年


1

DataMelt计算环境几乎具有针对任何主题的许多Java统计库。您可以按照网站上的建议使用Jython来使用它,但是我将其与Java和Groovy一起使用。

我可以说更多:DataMelt项目涵盖以下统计主题:

  • 随机数
  • 最受欢迎的离散和连续发行
  • 描述性统计分析
  • 数据拟合(线性和非线性)
  • 各种统计检验
  • 2D和3D直方图

这是一个使用对数似然法来拟合带有错误的数据的非线性回归示例:

在此处输入图片说明

该软件包是免费的。


3
欢迎来到@Remi网站。这实际上不是OP的问题的答案。这更多是评论。请仅使用“您的答案”字段提供答案。我知道这很令人沮丧,但是当您的信誉> 50时,您将可以在任何地方发表评论。或者,您可以尝试将其扩展以使其更多地成为答案。由于您是新手,所以您可能需要阅读我们的导览页面,其中包含新用户的信息。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.