XGBoost可以在预测阶段处理丢失的数据


12

最近,我回顾了XGBoost算法,并且注意到该算法可以在训练阶段处理丢失的数据(无需估算)。我想知道XGboost用于预测新观测值时是否可以处理丢失的数据(无需估算),还是有必要估算丢失的数据。

提前致谢。

Answers:


14

xgboost决定在训练时是否将缺失值输入到右节点或左节点。它选择最小化损失。如果在训练时没有缺失值,则默认将任何新的缺失发送到正确的节点。

如果您的缺失分布中有信号,则该模型基本上符合要求。

如果您的得分数据的缺失值与训练数据的分布不同,请当心。xgboost缺少的处理很方便,但不能防止屏蔽。

资料来源:这个答案

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.