12 最近,我回顾了XGBoost算法,并且注意到该算法可以在训练阶段处理丢失的数据(无需估算)。我想知道XGboost用于预测新观测值时是否可以处理丢失的数据(无需估算),还是有必要估算丢失的数据。 提前致谢。 machine-learning missing-data data-imputation xgboost — 里卡多·UES source
14 xgboost决定在训练时是否将缺失值输入到右节点或左节点。它选择最小化损失。如果在训练时没有缺失值,则默认将任何新的缺失发送到正确的节点。 如果您的缺失分布中有信号,则该模型基本上符合要求。 如果您的得分数据的缺失值与训练数据的分布不同,请当心。xgboost缺少的处理很方便,但不能防止屏蔽。 资料来源:这个答案 — 德克斯格罗夫 source