我已经使用rpart.control
了minsplit=2
,并得到了以下结果rpart()
功能。为了避免数据过拟合,是否需要使用拆分3或拆分7?我不应该使用拆分7吗?请告诉我。
在树构造中实际使用的变量:
[1] ct_a ct_b usr_a
Root node error: 23205/60 = 386.75
n= 60
CP nsplit rel error xerror xstd
1 0.615208 0 1.000000 1.05013 0.189409
2 0.181446 1 0.384792 0.54650 0.084423
3 0.044878 2 0.203346 0.31439 0.063681
4 0.027653 3 0.158468 0.27281 0.060605
5 0.025035 4 0.130815 0.30120 0.058992
6 0.022685 5 0.105780 0.29649 0.059138
7 0.013603 6 0.083095 0.21761 0.045295
8 0.010607 7 0.069492 0.21076 0.042196
9 0.010000 8 0.058885 0.21076 0.042196
1
我在您发布到上一个问题的后续活动中回答了这个问题。鉴于此,没有必要这样做。我提到您不应该编辑Q来跟进以供将来参考!
—
加文·辛普森,
为了避免以后再搜索相关问题,这里是指向先前问:stats.stackexchange.com/questions/13446/…的链接。
—
chl