对这两种技术之间的实际区别是否有一个非常简单的描述?
两者似乎都用于有监督的学习(尽管关联规则也可以处理无监督的学习)。
两者都可以用于预测
我发现最接近“良好”描述的是Statsoft教科书。他们说关联规则用于:
...检测大型数据集中分类变量的特定值之间的关系或关联。
虽然决策树分类器被描述为用于:
...根据案例或对象在一个或多个预测变量上的度量来预测类别因变量类别中的成员资格。
但是,在R Data Mining上,他们给出了与目标字段一起使用的关联规则的示例。
因此,两者都可以用来预测组成员身份,这是决策树可以处理非分类输入数据而关联规则不能处理的关键区别吗?还是有更根本的东西?一个站点(sqlserverdatamining.com)说,主要区别在于:
决策树规则基于信息获取,而关联规则基于流行度和/或置信度。
因此(可能回答了我自己的问题)是否意味着纯粹根据关联规则在数据集中出现的频率(以及它们为“真”的频率)进行评估,而决策树实际上正在尝试最小化方差?
如果有人知道一个好的描述,他们愿意指出我的观点,那就太好了。