为 Ross Quinlan 的 C5.0 构建 MATLAB 和 R 接口

机器算法验证 r 机器学习 matlab
2022-03-07 07:26:11

我正在考虑为Ross QuinlanC5.0构建 MATLAB 和 R 接口(对于那些不熟悉它的人,C5.0 是一种决策树算法和软件包;C4.5的扩展),我正在尝试了解我需要编写的组件。

我为 C5.0 找到的唯一文档是这里,这是 See5 的教程(C5.0 的 Windows 界面?)。tar文件带有一个 Makefile,但没有自述文件或任何其他文档

根据我在上面的教程中读到的内容,C5.0 使用基于 ASCII 的表示来处理输入和输出,并且我还在考虑构建一个直接在 MATLAB 或 R 和 C5.0 之间传递二进制数据的接口。任何其他机器学习/分类软件是否使用 C5.0 的数据表示?

有没有人尝试过为 ID3、C4.5 或 C5.0 构建 MATLAB 或 R 接口?

谢谢

4个回答

这听起来是个好主意,尤其是当您链接到的页面显示 C5.0 现在处于 GPL 之下时。

我有一些使用Rcpp将 C/C++ 软件包装到 R 的经验我很乐意提供帮助。

将 C/C++ 代码连接到 MATLAB 非常简单,您所要做的就是创建一个 MEX 网关函数来处理参数的转换和返回参数。我有制作 MEX 文件来做这类事情的经验,我很乐意提供帮助。

更新:

现在在 CRAN 上:

http://cran.r-project.org/web/packages/C50/index.html

原来的:

我们已经在这方面工作了一段时间(从 Cubist 开始,然后是 C5.0)。

如果你想贡献:

https://r-forge.r-project.org/projects/rulebasedmodels/

是最近创建的,我们应该检查初始代码。

我们已经访问了 Cubist 资源有一段时间了(但有明确的协议不将其链接到其他软件)并且一直在讨论合并代码的不同选项,但我认为

C5.0 (Linux) 文档位于http://rulequest.com/see5-unix.html