11 我想在一个不平衡的数据集上测试我训练有素的模型。是否有可用的算法从平衡的标记数据集(垃圾邮件/非垃圾邮件)生成合成数据? unbalanced-classes synthetic-data — 斯图尔特·彼得森 source 您始终可以通过简单地对一个类进行欠采样来平衡任何数据集。 — user2974951
8 尝试SMOTE,它是一种用于过采样的算法。它从您要过度采样的类中创建合成样本。 您可以使用它来创建所需数量的样本。 — 玛丽93 source 1 SMOTE也可以用于欠采样吗? — 斯图尔特·彼得森 好吧,您可以通过对notA类进行过采样来获得A类的欠采样... — kjetil b halvorsen 18/09/19 3 @StuartPeterson不,SMOTE是一种过采样算法,但是还有许多其他欠采样算法 — Mary93