Questions tagged «classification»

2
解释其决策的文本分类器
我正在为短句构建文本分类程序。除了告诉用户“您输入的文本的类别为C”之外,我还希望能够以简短易懂的方式解释为什么做出此决定。例如,我不想告诉用户“我将您的句子放入了一个复杂的3层神经网络,这是得分最高的答案”;我想要这样的解释:“由于训练数据中出现了X,Y和Z之类的句子,因此您的句子包含U,V和W这两个类别的特征”。 我的问题是:哪种分类算法最适合此类应用? k近邻似乎是一个很好的候选者,因为我可以告诉用户“您的句子具有类别C,因为它与具有相同类别的句子X,Y和Z相似。但是,它在文本分类问题上的性能众所周知我正在寻找一个可以在表现和解释能力之间取得平衡的分类。 编辑:花了很多时间寻找这样的分类器之后,我开始构建一个名为limdu的机器学习库,该库可以使分类器解释其决策。它仍在开发中,但是,它已经帮助我向自己和我的同事解释了为什么我们的分类器经常失败...

3
我什么时候应该移到k个最近的邻居
对于我们执行的许多机器学习项目,我们从k最近邻分类器开始。这是一个理想的起始分类器,因为我们通常有足够的时间来计算所有距离,并且参数的数量受到限制(k,距离度量和权重) 但是,这通常会导致我们坚持使用knn分类器,因为在项目的后期,没有空间可以切换到另一个分类器。尝试新分类器的充分理由是什么。明显的是记忆和时间限制,但是在某些情况下,另一个分类器实际上可以提高准确性吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.