Answers:
有几种方法可以确定数据是否可线性分离,本文重点介绍其中一些方法(1)。假设数据集中有两个类,以下是几种方法来确定它们是否可线性分离:
聚类方法:如果可以使用某些聚类方法(例如k均值)找到两个聚类纯度为100%的聚类,则数据是线性可分离的。
(1):Elizondo,D.,“线性可分离性问题:一些测试方法”,在《神经网络》,IEEE期刊,第17卷,第2期,第330-344页,2006年3月,doi:10.1109 / TNN。 2005.860871
safeBinaryRegression
还实现了线性编程方法。
硬边界SVM公式为
如果我们的数据是线性可分离的,那么所有不等式约束都将得到满足。通常,在求解二次程序时,内部点方法(可行的开始,中心路径跟随算法)仅在找到可行的w值以初始化问题后才进行w的求解。因此,可以解决以下LP来检查可行性。
如果对此问题的最优为零,我们知道可以满足原始不等式约束。这意味着我们的数据在原始空间中是线性可分离的。对每个训练示例使用单独的可以告诉我们哪些数据点导致线性不可分。
safeBinaryRegression