我有一些数据,我想根据这些数据建立模型(例如线性回归模型)。下一步,我想在模型上应用“留一法”交叉验证(LOOCV),以便了解其性能。
如果我对LOOCV的理解正确,那么我将使用除该样本(训练集)之外的每个样本为每个样本(测试集)建立一个新模型。然后,我使用该模型预测测试集并计算误差。
在下一步中,我汇总使用所选函数生成的所有误差,例如均方误差。我可以使用这些值来判断模型的质量(或拟合优度)。
问题:这些质量值适用的模型是哪个模型,因此,如果我发现从LOOCV生成的度量适合我的情况,我应该选择哪个模型?LOOCV研究了种不同的模型(其中是样本量);我应该选择哪种型号?
- 是使用所有样本的模型吗?在LOOCV流程中从未计算过该模型!
- 是误差最小的模型吗?
相关:stats.stackexchange.com/questions/11602。
—
变形虫说莫妮卡(