因此,我们有潜力将一种机器学习应用程序很好地适合分类器所解决的传统问题领域,即,我们拥有一组属性,这些属性描述了最终出现的项目和“存储桶”。但是,不是创建模型对于诸如朴素贝叶斯(Naive Bayes)或类似分类器之类的概率,我们希望我们的输出是一组大致人类可读的规则,可由最终用户查看和修改。
关联规则学习看起来像解决这类问题的算法家族,但是这些算法似乎专注于识别功能的常见组合,并且不包括这些功能可能指向的最终存储桶的概念。例如,我们的数据集如下所示:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
我只想要说“如果大而有两扇门,那是一辆卡车”的规则,而不是说“如果是四成之门也很小”的规则。
我可以想到的一种解决方法是,仅使用关联规则学习算法,而忽略不涉及结束存储桶的规则,但这似乎有些hacker。我是否错过了一些算法系列?还是我一开始就错误地解决了这个问题?