研究生统计学课程提供的用于统计学的开源 Java 库

机器算法验证 r sas 爪哇
2022-02-10 10:47:02

我正在学习应用统计学研究生课程,该课程使用以下教科书(让您了解所涵盖材料的水平): GK Bhattacharyya 和 RA Johnson 的统计概念和方法

教授要求我们使用 SAS 做作业。

我的问题是:是否有一个 Java 库,可以用来代替 SAS 来解决此类类中常见的问题。

我目前正在尝试使用Apache Math Commons,尽管我对该库印象深刻(它易于使用和易于理解),但它似乎缺乏甚至简单的东西,例如绘制直方图的能力(考虑将它与图表库结合起来)。

我看过柯尔特,但我最初的兴趣很快就消失了。

将不胜感激 - 我已经看过 Stackoverflow 上的类似问题,但没有发现任何令人信服的东西。

注意:我知道 R、SciPy 和 Octave 以及调用它们的 java 库——我正在寻找一个 Java 本地库或一组库,它们可以一起提供我正在寻找的功能。

注意:此类课程涵盖的主题通常包括:单样本和双样本检验以及均值和中位数的置信区间、描述性统计、拟合优度检验、单向和双向 ANOVA、同时推理、测试方差、回归分析和分类数据分析。

4个回答

当我被迫使用 java 进行基本统计时,apache commons math 是要走的路。对于情节,我使用并推荐JFreeChart后者被广泛传播,因此 stackoverflow 甚至有一个填充标签

编辑

如果您要寻找套件,那么Deducer可能是一种选择。GUI 基于 JGR,同时统计部分在 R 中调用。它似乎可以通过 R 和 java进行扩展。例如,可以跳过对 Rengine 的调用,而是调用引用的 java 库。但我承认,我还没有尝试过。

就我对 OP 的理解而言,最佳的应该是Rapidminer for Statistics之类的东西,因为 Rapidminer 是一个纯 Java 框架,它支持 GUI 访问(包括可视化)、用作库和自定义插件开发。据我所知,不存在类似的统计数据。不推荐Rapidminer用于该特定任务,因为据我所知,它仅包括最基本的统计测试。可视化最近得到了扩展,但我无法估计它们现在的可定制程度。

查看算术:NumericalMethod.com它一般不是免费的,但它可以免费用于学术用途。

steffen对 RapidMiner 的建议类似,您可能需要考虑Weka它可能比您希望的更适合机器学习。它有许多用于聚类、分类和回归等任务的算法。Weka 有一个 GUI,但它也可以用作软件库。我在 GUI 中看到了直方图,但我不确定通过库是否可以轻松地重用它们。

DataMelt计算环境有很多 Java 统计库,几乎适用于任何主题。您可以使用网站上提倡的 Jython 来使用它,但我将它与 Java 和 Groovy 一起使用。

我可以说更多:DataMelt 项目涵盖以下统计主题:

  • 随机数
  • 最流行的离散和连续分布
  • 描述性统计分析
  • 数据拟合(线性和非线性)
  • 各种统计测试
  • 2D 和 3D 直方图

这是一个非线性回归示例,使用对数似然方法来拟合具有错误的数据:

在此处输入图像描述

该软件包是免费的。