例如,当执行5倍交叉验证时,通常针对5倍的每一个都计算一条单独的ROC曲线,通常乘以带有std的平均ROC曲线。开发。显示为曲线厚度。
但是,对于LOO交叉验证,每个折叠中只有一个测试数据点,为该单个数据点计算ROC“曲线”似乎并不明智。
我一直在获取所有测试数据点(连同它们单独计算的p值)并将它们汇总到一个大集合中,以计算单个ROC曲线,但这在统计学上是洁行的吗?
当每个折叠中的数据点数为1时(如LOO交叉验证的情况),采用ROC分析的正确方法是什么?
为什么?你想用这样的生物完成什么?
我需要分析一系列p值阈值的总体预测性能,而ROC曲线是我传统上用于其他所有类型交叉验证的方法。因此,与ROC分析在任何k折交叉验证中都非常有用的原因基本相同。如果对于LOO xval有不同的类似方法,那么也很了解。另外,如果我有足够的数据,我会做10倍xval之类的事情,这不会成为问题。
—
user1121 2011年
我要说的是,您正在明智地做,只需使用真实的标签和每种情况下的预测值(在这种情况下是
—
坚持不懈