我正在学习SVM分类并遇到问题。我不确定这个难题是否有专门的术语。
假定我们要根据SVM对患者(既有健康人,也有性别)和肝癌(有性别)的样本进行分类。如果我们将健康人样本标记为1类,将癌症人标记为2类,则可以训练二进制SVM并获得分类器1来预测任何新患者。现在,想象另一个场景。假设我们先将所有样本按性别划分,然后再进行SVM分类。对于每种性别,我们仍将健康患者与癌性患者分为2类,并训练二元SVM分别获得女性和男性样本的分类器2和分类器3。问题是是否有新的女性患者,应该使用哪个分类器1或2来获得更准确的预测?这是我争论的两难境地
(1)当样本数量很大时,预测应该更准确。基于此论点,分类器1似乎是一个不错的选择。
(2)但是,如果我们首先将样本分为女性和男性,分类器2似乎是更好的选择,因为新患者(未知检测样本)是女性。
这种困境是否有术语,或者有人知道任何进一步的信息,或者如何解决这样的问题?我什至不确定这是否是一个合法的问题,并且对预先提出的幼稚问题表示抱歉。谢谢