我需要通过应用随机森林算法来找到训练数据集的准确性。但是我的数据集类型既是分类的又是数字的。当我尝试拟合这些数据时,出现错误。
'输入包含NaN,无穷大或dtype('float32')太大的值。
问题可能出在对象数据类型上。如何在不进行RF转换的情况下拟合分类数据?
这是我的代码。
如果您正在使用树模型,则无需执行one_hot,因为它不像其他方法那样测量距离。
—
Jun Yang
@ JunYang,scikit-learn当前确实需要编码类别。
—
Ben Reiniger,