Answers:
海因
有很多具有可用功能的工具和库。
选择哪个取决于您是要使用gui进行工作还是将其嵌入到其他程序中。
独立的数据挖掘工具(还有带有Java接口的WEKA等):
基于文本:
库:
如果您足够了解一种编程语言,则可以使用该语言的lib或尝试使用R。如果没有,您可以尝试使用带有gui的工具之一。
R中的树形示例:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
如建议的那样,使用R进行分析需要您自己编写代码,但是您会找到适用于大多数分类任务的软件包,这些软件包可以立即使用。可以在这里找到概述机器学习任务视图
要开始使用RapidMinder,您应该先看看Youtube。即使是决策树也有一些截屏视频。
Weka是一个免费的开放源代码的机器学习工具套件。如果需要,它们具有GUI以及从Java代码中调用的API。
他们有许多分类算法,包括几种决策树算法。这些在用户界面中可用。最近的邻居更加棘手,似乎您必须直接使用API。
我认为Rapid Miner可能支持这种类型的东西,但是我以前从未将其用于此类目的。
您可能还会考虑R,但这可能需要使您的手变脏一点。
请注意,Netflix在电影分级分类方面做了很多工作。几年前,他们向小组提供了100万美元的奖金,这可以最大程度地提高他们的分类。您可能会对阅读各种团队如何解决该问题感兴趣。
可能是... WEKA? http://www.cs.waikato.ac.nz/ml/weka/