我什至不确定这个问题是否有意义,但是我想我看到了几篇论文的标题,他们提出了具有随机效果的随机森林。在R中这可能吗?
我什至不确定这个问题是否有意义,但是我想我看到了几篇论文的标题,他们提出了具有随机效果的随机森林。在R中这可能吗?
Answers:
它们通常不一起使用,在组合它们之前应小心。
随机森林通常用作分类器。您使用随机森林而不是其他方法(例如,K-均值聚类)的原因是,您可能要分类的维数很多。拥有大量维的问题在于,如果您要测试维订单的所有组合,则将有很多选择(其增长速度快于因数维的数量)。
随机效应通常用于对同一事物进行重复测量的回归中。它们通常用于混合效应模型,其中术语“混合”是指固定效应和随机效应。固定效果被认为代表您将再次看到的参数(例如,药物或人的年龄)。随机效应被认为代表了您不会再次看到的参数(例如特定人员)周围的可变性实例。
当存在群集数据http://dx.doi.org/10.1080/00949655.2012.741599和http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf时,有一些示例将它们一起使用。
我不知道任何可以进行此分析的R软件包。
是的,有可能。您应该签出“ RE-EM树:纵向和集群数据的数据挖掘方法 ”,以及相关的R包REEMtree。
自从我看报纸已经有一段时间了。我记得作者还没有尝试形成这些树的合奏,但是没有什么暗示它不起作用。
混合效果随机森林(MERF)是一回事。正如上面的回答所言,Larocque博士在HEC蒙特利尔的团队进行了一些出色的研究。该文件在这里:http : //www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599。
从本质上讲,将随机森林的非线性建模与线性随机效应相结合是一种理论上合理的方法。
我们刚刚在Python中发布了一个使用上述算法实现MERF的开源软件包。
我们撰写了有关该软件包以及如何将其用于群集数据集的详细博客文章。