除了明显的分类器特征,例如
- 计算成本,
- 功能/标签的预期数据类型和
- 适用于某些大小和尺寸的数据集,
首先对一个尚不十分了解的新数据集(例如语义和各个特征的相关性)首先尝试的前五个(或10、20?)分类器是什么?通常,我尝试使用朴素贝叶斯,最近邻居,决策树和SVM-尽管我没有充分的理由选择此选项,但我了解它们并主要了解它们的工作原理。
我猜应该选择涵盖最重要的通用分类方法的分类器。根据该标准或其他任何原因,您会推荐哪种选择?
更新:针对该问题的另一种表述可能是:“存在哪些通用的分类方法,哪些特定方法涵盖了最重要/最受欢迎/有希望的方法?”
我认为这是(stats.stackexchange.com/questions/3458/…)的副本。该问题的唯一附加价值可能是“选择分类器的准则”(这将使问题成为非常通用的问题)。如果是重复的,请关闭,否则请投票;)
—
steffen
@steffen:您提到的问题很有帮助,但我认为这不是重复的。确实,我的问题很笼统。我不是在寻找特定问题的解决方案,而是出于一般原因,为什么要使用哪些学习者-我将相应地更新我的问题。
—
Oben Sonne