我目前正在使用带有以下代码的Scikit学习:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
然后用7个不同的标签拟合并预测一组数据。我得到了一个奇怪的输出。无论我在验证集上使用预测的标签是哪种交叉验证技术,始终都是标签7。
我尝试了其他一些参数,包括完整的默认参数one(svm.SVC()
),但是只要我使用的内核方法rbf
代替,poly
否则linear
它将无法工作,而对于poly
and 来说确实很好linear
。
此外,我已经尝试对火车数据而不是验证数据进行预测,它非常适合。
有人以前见过这种问题,知道这里发生了什么吗?
我从不详细查看我的班级分布,但我知道应该有30%左右是7、14%是4。
我什至尝试手动进行1-vs-rest实施,但仍然没有帮助。
您的数据属于每个类别的比例是多少?
—
gung-恢复莫妮卡
我的数据中确实有更多的“ 7”,但不多。其中约30%是7。@gung
—
Tamaki Sakura