构建与Ross Quinlan C5.0的MATLAB和R接口


10

我正在考虑为Ross QuinlanC5.0构建MATLAB和R接口(对于不熟悉它的人,C5.0是决策树算法和软件包;是C4.5的扩展),而我试图了解我需要编写的组件。

我在这里找到的有关C5.0的唯一文档在这里,这是See5(C5.0的Windows界面)的教程。该焦油文件带有一个Makefile,但没有自述文件或任何其他文件。

根据我在上面的教程中所读的内容,C5.0使用基于ASCII的表示形式来处理输入和输出,并且我还在考虑构建一个接口,该接口直接在MATLAB或R和C5.0之间传递二进制数据。其他任何机器学习/分类软件都使用C5.0的数据表示吗?

之前有人尝试过建立针对ID3,C4.5或C5.0的MATLAB或R接口吗?

谢谢


这个项目正在进行吗?我试图在R中安装软件包C5.0,但是失败了。

您是否曾经为Matlab实施过C5?如果您这样做,它将非常有用。我现在正在看C5与Matlab的接口,但是C5似乎有点混乱(因为它使用了困难的格式,所以不能随便传递文本文件)。
dcm29'2

Answers:


11

这听起来像是一个好主意,尤其是当您链接到的页面显示C5.0现在在GPL之下时。

我有一些使用Rcpp将C / C ++软件包装到R中的经验;我很乐意提供帮助。


1
非常感谢您提供的帮助。我们实验室中有几个学生可能会对此进行研究。一旦发现问题,我们会尽快通知您:)
Amelio Vazquez-Reina

5

将C / C ++代码与MATLAB接口非常简单,您所要做的就是创建一个MEX网关函数来处理参数的转换和返回参数。我具有制作MEX文件来执行此类操作的经验,很乐意提供帮助。


听起来不错!感谢您愿意提供帮助。我们的实验室中有几个学生,如果我们需要帮助,他们可能会与您联系。
Amelio Vazquez-Reina

4

更新:

现在在CRAN上:

http://cran.r-project.org/web/packages/C50/index.html

原版的:

我们已经为此工作了一段时间(从Cubist开始,然后在C5.0上工作)。

如果您想贡献:

https://r-forge.r-project.org/projects/rulebasedmodels/

是最近创建的,我们应该在其中检查初始代码。

我们已经访问了Cubist源码已有一段时间了(但是有明确的协议不将其链接到其他软件),并且正在讨论合并代码的不同选择,但是我很瘦


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.