Answers:
您应该将它们都作为参数调整的一部分进行尝试。
从理论上讲,基尼杂质会最小化Brier得分,而熵/信息增益会最小化对数损失,因此您感兴趣的对象中有哪些会有所不同。但是,其他事情,例如每件事在贪婪的树生长中发现多变量效应的可能性如何,而不是被也参与其中的单变量变量“分散”注意力。即,您可能会从不总是选择“最佳”拆分的杂质度量中得到更好的概括。
在实践中(在rf的背景下,比购物车更重要),我发现熵对于更干净的低维数据集更适用,在这种情况下,您尝试尽可能地适应更复杂的信号,而gini对于嘈杂的高维数据则更好。您尝试从许多嘈杂的潜在信号中发现一个简单信号的信号。不过,这只是我的经验,几乎肯定不会在所有情况下都适用。
注意:以评论开始,但删除并移至答案以格式化事物的格式。