我对使用机器学习算法(例如k-NN,Random Forest,决策树等)了解现有的用于土地分类的软件感兴趣。我知道R,MILK和SPy中的randomForest软件包。
存在哪些适用于土地覆被分类的开源或商业机器学习算法?
我对使用机器学习算法(例如k-NN,Random Forest,决策树等)了解现有的用于土地分类的软件感兴趣。我知道R,MILK和SPy中的randomForest软件包。
存在哪些适用于土地覆被分类的开源或商业机器学习算法?
Answers:
我不得不说,用于机器学习和非参数建模的最完整的软件环境是R。这是统计学中的一个大领域,涵盖K-NN,内核平滑,通用加性模型,弱学习者,支持向量,神经网络,半参数样条回归,归因等...我强烈建议阅读:Hastie,T.,R. Tibshirani,J.Friedman(2009)统计学习的要素:数据挖掘,推理和预测。统计中的Springer系列。
除R外,Salford Systems的商业软件还具有GUI环境中可用的随机森林,多元自适应回归样条,CART和渐变增强(TreeNet)。RuleQuest仍在销售See5 / C5,它是C4 / ID3 CART算法的更新版本。怀卡托大学的Weka 3是开放源代码GUI / Commandline Java,具有大量可用模型。
我强烈建议使用scikits-learn for Python。它支持有监督和无监督的分类,并且文档非常好(特别是查看机器学习的天文学数据分析教程和随附的YouTube视频(注意:这是3个小时的时间))。
该项目正在积极开发中,最新版本为9月发布的0.12。
至于包的功能,请参阅最近的邻居, 随机森林(在Ensembe方法下)和决策树以使用您给出的示例。
不幸的是,除非您想花费时间来构建一个GUI,否则没有GUI,但是我建议将iPython IDE作为出色的交互式脚本环境,包括QT控制台中带有matplotlib的内联图。
您的问题假设用于土地分类的机器学习算法与其他机器学习应用程序所使用的软件有所不同。有些应用程序由于其不寻常的特性而需要特殊处理,但是我没有理由认为土地使用需要特殊处理。如果可以将土地利用数据以标准的逗号分隔形式输入,则R等现有工具应该可以。现在可能有也可能没有土地使用软件使用从机器学习技术中发现的模型,但这是一个不同的问题。
在第一个回复后进行编辑。->大多数用于机器学习的主要软件包都具有一些用于空间可视化的工具,尽管它们当然可能无法满足您的特定需求。例如,您是否熟悉用于空间数据可视化的R的sp库?让我们看看是否可以找到一个合适的链接,使您可以使用它做事。
http://rwiki.sciviews.org/doku.php?id=tips:spatial-data:spatial_data_visualization 有关R中对空间分析有用的工具的更广泛的列表,您可能需要查看http://cran.r- project.org/web/views/Spatial.html,因为它包括用于地统计,生态分析等的工具。
杜克大学之外的一组人员为ArcGIS开发了一些有趣的脚本工具,包括随机森林模型。
您也可以使用QGIS的DTclassifier(决策树分类器)插件进行土地分类。它提供了用于使用决策树对栅格数据进行分类的简单界面,以便在QGIS中执行。