如何在rpart（）中选择分割数？

我已经使用rpart.control了minsplit=2，并得到了以下结果rpart()功能。为了避免数据过拟合，是否需要使用拆分3或拆分7？我不应该使用拆分7吗？请告诉我。

在树构造中实际使用的变量：

[1] ct_a ct_b usr_a

Root node error: 23205/60 = 386.75

n= 60        

    CP nsplit rel error  xerror     xstd
1 0.615208      0  1.000000 1.05013 0.189409
2 0.181446      1  0.384792 0.54650 0.084423
3 0.044878      2  0.203346 0.31439 0.063681
4 0.027653      3  0.158468 0.27281 0.060605
5 0.025035      4  0.130815 0.30120 0.058992
6 0.022685      5  0.105780 0.29649 0.059138
7 0.013603      6  0.083095 0.21761 0.045295
8 0.010607      7  0.069492 0.21076 0.042196
9 0.010000      8  0.058885 0.21076 0.042196

r cart rpart

— 萨马拉萨
source

我在您发布到上一个问题的后续活动中回答了这个问题。鉴于此，没有必要这样做。我提到您不应该编辑Q来跟进以供将来参考！

— 加文·辛普森，

为了避免以后再搜索相关问题，这里是指向先前问：stats.stackexchange.com/questions/13446/…的链接。

— chl

约定是在最佳树的一个标准误差内使用最佳树（最低交叉验证相对误差）或最小（最简单）树。最好的树在第8行（7个拆分）中，但是第7行的树（6个拆分）有效地完成了相同的工作（xerror对于第7行的树= 0.21761，该值在（小于）xerror最好的树加一个标准的范围之内误差（xstd，（0.21076 + 0.042196）= 0.252956）并且更简单，因此1条标准误差规则会选择它。

— 加文·辛普森
source