首先,一些警告
我不确定为什么您不能使用您喜欢的编程(子)范例*,归纳逻辑编程(ILP)或您尝试分类的内容。提供更多细节可能会导致更好的答案。尤其是因为根据与之关联的编程范式来选择分类算法有点不寻常。如果您的真实示例是机密的,则只需构成一个虚构但类似的示例。
没有ILP的大数据分类
话虽如此,在排除ILP之后,我们在考虑的范围内还有其他4种逻辑编程范例:
- 诱拐的
- 答案集
- 约束
- 功能性
除了逻辑编程之外的数十种范式和子范式。
例如,在功能逻辑编程中,存在称为归纳功能逻辑编程的ILP扩展,该扩展基于反转缩小(即缩小机制的反转)。这种方法克服了ILP的一些局限性(至少根据一些学者的观点)适合于表示形式的应用,并具有允许以更自然的方式表达问题的好处。
在不了解数据库的详细信息以及使用ILP所面临的障碍的情况下,我不知道这是否解决了您的问题或遭受了同样的问题。因此,我还将提出一种完全不同的方法。
ILP与“经典”或“命题”方法进行数据挖掘形成对比。这些方法包括机器学习的实质,例如决策树,神经网络,回归,装袋和其他统计方法。您可以加入使用高性能计算(HPC)来将这些方法用于海量数据集的许多数据科学家,大数据工程师和统计学家的行列,而不是因为数据量大而放弃这些方法。您还可以选择抽样和其他统计技术来减少计算资源和分析关系数据库中大数据所需的时间。
HPC包括利用多个CPU内核,通过弹性使用具有高内存和大量快速CPU内核的服务器来扩展分析,使用高性能数据仓库设备,采用群集或其他形式的并行计算等。我不确定要使用哪种语言或统计套件分析数据,但是作为示例,该CRAN任务视图列出了R语言的许多HPC资源,这将使您可以扩展命题算法。