Questions tagged «classification»

有监督学习的实例,用于标识新数据集实例所属的一个或多个类别。

1
不使用ILP的关系数据挖掘
我有一个来自关系数据库的庞大数据集,需要为其创建分类模型。通常在这种情况下,我会使用归纳逻辑编程(ILP),但由于特殊情况,我无法做到这一点。 解决此问题的另一种方法是,当我有外交关系时尝试合计价值观。但是,对于某些名义属性,我有成千上万的重要且不同的行(例如:与几种不同的药物处方有关的患者)。因此,如果不为该名义属性的每一行创建一个新属性,我就无法做到这一点,而且如果我这样做的话,大多数新列将具有NULL值。 是否有任何非ILP算法可以让我在不使用数据透视之类的技术的情况下对关系数据库进行数据挖掘,该技术会创建成千上万的新列?

1
分类处理不平衡班级的方法
对已解决不平衡类问题的方法进行分类的最佳方法是什么? 此文章对其进行分类为: 预处理:包括过采样,欠采样和混合方法, 成本敏感型学习:包括直接方法和元学习,后者进一步分为阈值和抽样, 合奏技术:包括对成本敏感的合奏和数据预处理以及合奏学习。 在第二个分类: 数据预处理:包括分布更改和加权数据空间。一类学习被认为是分布的变化。 特殊目的学习方法 预测后处理:包括阈值方法和对成本敏感的后处理 混合方法: 第三篇文章: 数据级方法 算法级方法 混合方法 最后的分类也将输出调整视为独立的方法。 提前致谢。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.