我正在处理有监督的二进制分类问题。我想使用GBM软件包将个人分类为未感染/已感染。我的未感染人数是感染者的15倍。
我想知道GBM模型在班级规模不均衡的情况下是否会受到影响?我没有找到回答该问题的参考文献。
我尝试通过为未感染的个体分配1的权重并为感染的个体分配15的权重来调整权重,但是结果却很差。
1
(旁注)如果您提供GBM所代表的含义以及指向该软件包的链接,将会很有帮助。
—
2015年
您在梯度提升模型中使用哪个损失函数?对于不平衡类,当我使用平均绝对错误时,我发现性能很差,因为它似乎偏爱最普通的类。当我使用均方误差时,性能大大提高了
—
Ryan Zotti 2015年
仅供以后参考,我发现插入符号对数损失(跨距)所使用的默认损失函数也非常有用。(它会以负对数尺度严重惩罚错误的案例)
—
Lily Long