假设我对三个类,和。但是我的数据集实际上包含了更多的真实类。c 2 c 3(c j )n j = 4
显而易见的答案是定义一个新类,它引用所有类,但是我怀疑这不是一个好主意,因为的样本将很少并且彼此之间不太相似。çĴĴ>3 Ç 4
为了可视化我要说的内容,假设我有以下两个变量空间,并且类,,,分别用红色,直到,绿色和黑色分别。这就是我怀疑我的数据的样子。c ^ 2 ç 3 Ç 4 = ⋃ Ñ Ĵ = 4 Ç Ĵ
有没有解决此问题的标准方法?什么是最有效的分类器,为什么?
考虑使用一个vs.休息en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest
—
DaL