2
k倍交叉验证中的方差估计
K折交叉验证可用于估计给定分类器的泛化能力。我是否可以(也应该)从所有验证运行中计算出汇总的方差,以便更好地估计其方差? 如果没有,为什么? 我发现了在交叉验证运行中确实使用汇总标准差的论文。我还发现有论文明确指出,对于验证方差没有统一的估计。但是,我也发现了一些论文,这些论文显示了一些泛化误差的方差估计量(我仍在阅读并尝试理解这一点)。人们在实践中实际上做什么(或举报)? 编辑:当使用CV来衡量粗略的分类错误(即,一个样本已正确标记或未标记;例如,真或假)时,谈论合并方差可能没有任何意义。但是,我所说的是我们估计的统计量确实定义了方差的情况。因此,对于给定的倍数,我们最终可以得到统计值和方差估计值。丢弃此信息并仅考虑平均统计数据似乎是不正确的。虽然我知道我可以使用自举方法构建方差估计,但是(如果我不是很错的话)这样做仍然会忽略倍数方差,仅考虑统计估计(并且需要更多的计算能力)。