我有一个输入和输出的多输出回归问题。输出具有复杂的非线性相关结构。
我想使用随机森林进行回归。据我所知,用于回归的随机森林仅适用于单个输出,因此我将必须训练随机森林-每个输出一个。这忽略了它们的相关性。
是否有将输出相关性考虑在内的随机森林扩展?也许类似高斯过程回归的多任务学习。
4
到目前为止,这是我能够挖掘的内容:scikit-learn.org/dev/modules/tree.html#multi-output-problems
—
sergeyf 2012年
当然。我有肽的高维“图像”(实际上是dI / dV光谱)。目的是弄清楚组成肽的氨基酸的位置和类别。我的第一种方法是图像分割,但是CRF和按像素排列的随机森林失败了。所以现在,我不是说每个像素“属于”一个和一个氨基酸(不是真的),而是为每个像素分配来自附近氨基酸的相对“影响”值。这将导致每个像素的直方图。因此,多重输出回归!
—
sergeyf 2012年
这可能是一个迟来的答复:在Crimisini等人中。决策森林:分类,回归,密度估计,流形的统一框架学习决策森林使用RF的方式可能适合您进行器官边界识别。
—
西蒙妮
这也可能要晚了,但可能会帮助绊脚的任何人。使用多变量数据可以轻松地训练随机森林。一切都以相同的方式发生,但是我们使用多个输出变量的协方差,而不是使用方差来进行信息增益计算。更重要的是,叶子现在包含N维PDF。
—
masad 2014年
我不知道RF“这忽略了它们的相关性”。考虑到RF的整体性,我认为它们可能会说明相关性。如果他们接受单变量输入并给出单变量输出,那么他们就不会考虑相关性。
—
EngrStudent-恢复莫妮卡2015年