Answers:
是否有任何文献列举算法的特征以使它们可以解释?
我知道的唯一文献是Ribero,Singh和Guestrin 最近发表的论文。他们首先定义了单个预测的可解释性:
通过“解释预测”,我们表示呈现文本或视觉工件,从而提供对实例组件(例如,文本中的单词,图像中的补丁)与模型的预测之间的关系的定性理解。
作者进一步阐述了这对于更具体的示例意味着什么,然后使用此概念定义模型的可解释性。他们的目标是尝试并人工地为不透明的模型添加解释性,而不是比较现有方法的解释性。无论如何,本文都可能会有所帮助,因为尝试围绕“解释性”概念引入更精确的术语。
是否存在公认的代表两者之间良好权衡的机器学习模型?
我同意@Winter的观点,可以将弹性网(不仅用于逻辑回归)看作是预测准确性和可解释性之间取得良好折衷的一个示例。
对于不同类型的应用程序域(时间序列),另一类方法也提供了一个很好的折衷方法:贝叶斯结构时间序列建模。它继承了经典结构时间序列建模的可解释性,并继承了贝叶斯方法的一些灵活性。与逻辑回归相似,可解释性通过建模所使用的回归方程式得到帮助。请参阅本文,以获得在市场营销中的良好应用和更多参考。
与刚才提到的贝叶斯上下文有关,您可能还需要查看概率图形模型。它们的可解释性不依赖于回归方程,而是依赖于图形化的建模方式。有关出色的概述,请参见Koller和Friedman撰写的“概率图形模型:原理和技术”。
我不确定我们是否可以将上述贝叶斯方法称为“通常公认的良好折衷”。为此,它们可能还不够为人所知,尤其是与弹性网示例相比。
是否存在公认的代表两者之间良好权衡的机器学习模型?
我认为,通过善于预测,您的意思是能够拟合数据中存在的非线性,同时对过度拟合具有相当强的鲁棒性。可解释性与能够预测这些非线性之间的权衡取决于数据和所提出的问题。在数据科学中,确实没有免费的午餐,而且没有一种算法可以被认为是适用于任何数据集的最佳算法(对于可解释性也是如此)。
一般规则应该是,您知道的算法越多,对您越有帮助,因为您可以更轻松地满足特定需求。
如果必须为我经常在商业环境中使用的分类任务选择最喜欢的对象,那么我将为弹性回归选择弹性网。尽管对生成数据的过程有很强的假设,但由于正则化术语保持了基本逻辑回归的可解释性,因此可以轻松地将其应用于数据。
是否有任何文献列举算法的特征以使它们可以解释?
我建议您选择一本写得很好的书,其中描述了常用的机器学习算法以及不同情况下的优缺点。这样的书的一个例子可以是T. Hastie,R。Tibshirani和J. Friedman 撰写的《统计学习的要素》。