当我在Matlab中使用神经网络工具箱时,我感到困惑。
它将原始数据集分为三个部分:
- 训练集
- 验证集
- 测试集
我注意到在许多训练或学习算法中,数据通常分为训练集和测试集两部分。
我的问题是:
- 验证集和测试集有什么区别?
- 验证集是否真的特定于神经网络?或者它是可选的。
- 更进一步,在机器学习的上下文中,验证和测试之间有区别吗?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.