应用套索对特征进行排名并得到以下结果:
rank feature prob.
==================================
1 a 0.1825477951589229
2 b 0.07858498115577893
3 c 0.07041793111843796
请注意,数据集具有3个标签。不同标签的功能等级相同。
然后将随机森林应用于相同的数据集:
rank feature score
===================================
1 b 0.17504808300002753
6 a 0.05132699243632827
8 c 0.041690685195283385
请注意,排名与套索产生的排名有很大不同。
如何解释差异?是否暗示基础模型固有地是非线性的?
功能的等级并不能真正在不同的分类器之间转换。要测试模型是非线性的,在这里看到,例如:stats.stackexchange.com/questions/35893/...
—
亚历R.
功能重要性仅是基于“启发式”的建议。有时它们可能不可靠。我通常比拉索更信任随机森林。
—
Gerenuk'6