1
不使用ILP的关系数据挖掘
我有一个来自关系数据库的庞大数据集,需要为其创建分类模型。通常在这种情况下,我会使用归纳逻辑编程(ILP),但由于特殊情况,我无法做到这一点。 解决此问题的另一种方法是,当我有外交关系时尝试合计价值观。但是,对于某些名义属性,我有成千上万的重要且不同的行(例如:与几种不同的药物处方有关的患者)。因此,如果不为该名义属性的每一行创建一个新属性,我就无法做到这一点,而且如果我这样做的话,大多数新列将具有NULL值。 是否有任何非ILP算法可以让我在不使用数据透视之类的技术的情况下对关系数据库进行数据挖掘,该技术会创建成千上万的新列?