随机森林进行多元回归

我有一个输入和输出的多输出回归问题。输出具有复杂的非线性相关结构。 $d_x$ $d_y$

我想使用随机森林进行回归。据我所知，用于回归的随机森林仅适用于单个输出，因此我将必须训练随机森林-每个输出一个。这忽略了它们的相关性。 $d_y$

是否有将输出相关性考虑在内的随机森林扩展？也许类似高斯过程回归的多任务学习。

regression multivariate-analysis random-forest

— 谢尔盖夫
source

到目前为止，这是我能够挖掘的内容：scikit-learn.org/dev/modules/tree.html#multi-output-problems

— sergeyf 2012年

当然。我有肽的高维“图像”（实际上是dI / dV光谱）。目的是弄清楚组成肽的氨基酸的位置和类别。我的第一种方法是图像分割，但是CRF和按像素排列的随机森林失败了。所以现在，我不是说每个像素“属于”一个和一个氨基酸（不是真的），而是为每个像素分配来自附近氨基酸的相对“影响”值。这将导致每个像素的

直方图。因此，多重输出回归！

d_{y}

$d_y$

— sergeyf 2012年

这可能是一个迟来的答复：在Crimisini等人中。决策森林：分类，回归，密度估计，流形的统一框架学习决策森林使用RF的方式可能适合您进行器官边界识别。

— 西蒙妮

这也可能要晚了，但可能会帮助绊脚的任何人。使用多变量数据可以轻松地训练随机森林。一切都以相同的方式发生，但是我们使用多个输出变量的协方差，而不是使用方差来进行信息增益计算。更重要的是，叶子现在包含N维PDF。

— masad 2014年

我不知道RF“这忽略了它们的相关性”。考虑到RF的整体性，我认为它们可能会说明相关性。如果他们接受单变量输入并给出单变量输出，那么他们就不会考虑相关性。

— EngrStudent-恢复莫妮卡2015年

这是使用面部识别进行的多输出回归问题的示例。它还包括一个编码示例，应该使您从方法论入手。http://scikit-learn.org/stable/auto_examples/plot_multioutput_face_completion.html

— 橙色1
source

有专门针对此的新程序包（未经个人测试）

— MM
source