2
解释其决策的文本分类器
我正在为短句构建文本分类程序。除了告诉用户“您输入的文本的类别为C”之外,我还希望能够以简短易懂的方式解释为什么做出此决定。例如,我不想告诉用户“我将您的句子放入了一个复杂的3层神经网络,这是得分最高的答案”;我想要这样的解释:“由于训练数据中出现了X,Y和Z之类的句子,因此您的句子包含U,V和W这两个类别的特征”。 我的问题是:哪种分类算法最适合此类应用? k近邻似乎是一个很好的候选者,因为我可以告诉用户“您的句子具有类别C,因为它与具有相同类别的句子X,Y和Z相似。但是,它在文本分类问题上的性能众所周知我正在寻找一个可以在表现和解释能力之间取得平衡的分类。 编辑:花了很多时间寻找这样的分类器之后,我开始构建一个名为limdu的机器学习库,该库可以使分类器解释其决策。它仍在开发中,但是,它已经帮助我向自己和我的同事解释了为什么我们的分类器经常失败...