我通过随机森林对具有二进制目标类的数据集进行拟合。在python中,我可以通过randomforestclassifier或randomforestregressor做到这一点。
我可以直接从randomforestclassifier获得分类,也可以先运行randomforestregressor并获得一组估计分数(连续值)。然后,我可以找到一个临界值,以从分数集中得出预测的类别。两种方法都可以达到相同的目标(即预测测试数据的类别)。
我也可以观察到
randomforestclassifier.predict_proba(X_test)[:,1])
与...不同
randomforestregressor.predict(X_test)
因此,我只想确认两种方法均有效,然后在随机森林应用中哪种方法更好?