我正在使用python中的scikit-learn库。在下面的代码中,我正在预测概率,但是我不知道如何读取输出。
测试数据
from sklearn.ensemble import RandomForestClassifier as RF
from sklearn import cross_validation
X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]])
y = np.array([0,1,1,0,1,2])
分割数据集
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.5, random_state=0)
计算概率
clf = RF()
clf.fit(X_train,y_train)
pred_pro = clf.predict_proba(X_test)
print pred_pro
输出
[[ 1. 0.]
[ 1. 0.]
[ 0. 1.]]
X_test列表包含3个数组(我有6个样本,test_size = 0,5),所以输出也有3个。
但是我要预测3个值(0,1,2),所以为什么每个数组只能得到2个元素?
我应该如何读取输出?
我还注意到,当我修改y中不同值的数量时,输出中的列数始终是y -1的不同计数。
欢迎来到CrossValidated。您在下面看到我的回答了吗?如果它解决了您的问题,请继续并将其标记为正确答案。否则,让我知道缺少的内容,我会尽力为您清除。
—
奔