问题是决策树的建立。根据维基百科,“ 基尼系数 ”不应与“ 基尼杂质 ” 相混淆。但是,在构建决策树时可以同时使用两种方法-在拆分项目集时,这些方法可以支持我们的选择。
1)'基尼杂质'-它是标准的决策树拆分指标(请参见上面的链接);
2)'基尼系数'-可以基于AUC标准评估每个分裂。对于每种拆分方案,我们都可以构建ROC曲线并计算AUC度量。根据维基百科AUC =(GiniCoeff + 1)/ 2;
问题是:这两项措施是否相等?一方面,我被告知不要将基尼系数与基尼杂质混淆。另一方面,这两种措施都可以用于做同一件事-评估决策树拆分的质量。