Answers:
如果要测试模型的性能(即,不优化参数),通常将汇总混淆矩阵。像这样想,您已将数据分成10个不同的折或“测试”集。您在折痕的9/10上训练模型,然后测试第一个折痕并获得混淆矩阵。此混淆矩阵表示数据的1/10的分类。您使用下一个“测试”集再次重复分析,并获得另一个表示另外1/10数据的混淆矩阵。现在,将这个新的混淆矩阵添加到第一个矩阵中将代表您数据的20%。继续操作,直到完成所有折叠,对所有混淆矩阵求和,最后的混淆矩阵代表该模型对所有数据的性能。您可以对混淆矩阵求平均值,但实际上并不能提供累积矩阵中的任何其他信息,如果折叠的大小不尽相同,则可能会有偏差。
注意 -假设您的数据没有重复采样。我不能完全确定重复采样是否会有所不同。如果我学到一些东西或有人推荐一种方法,将会更新。