折刀vs.LOOCV


Answers:


11

在交叉验证中,您将对剩余样本进行统计。大多数情况下,您是根据建立在保留样本上的模型来预测剩余样本的。在叠加中,您仅从保留的样本中计算统计信息。


4
我不明白这个答案在原始问题中对LOOCV的影响。在何种意义上一个“计算统计数据”上的留出的观察?
亚历克西斯

12

折刀通常指的是两个相关但不同的过程,这两个过程都依赖于“留一法”的处理方法,这导致了非常混乱的情况。

在一种情况下,折刀可用于估计种群参数及其标准误差。例如,使用折刀方法来估计简单回归模型的斜率和截距,将:

  1. 估计斜率并使用所有可用数据进行截距。
  2. 省略1个观测值并估计斜率和截距(也称为系数的“部分估计”)。
  3. 计算斜率和截距的“部分估计”和“所有数据”估计之间的差(也称为系数的“伪值”)。
  4. 对整个数据集重复步骤2和3。
  5. 计算每个系数的伪值的平均值-这些是斜率和截距的折刀估计

系数的伪值和折刀估计也可以用于确定标准误差,从而确定置信区间。通常,此方法可为系数提供更大的置信区间,因为它是更好,更保守的不确定性度量。同样,该方法也可用于获得系数的偏斜的折弯估计。

在另一方面,折刀用于评估模型性能。在这种情况下,折刀=留一法交叉验证。两者都涉及将一个观测值排除在校准数据集中之外,重新校准模型,并预测遗漏的观测值。本质上,每个观察都使用其对预测变量的“部分估计”进行预测。

这是我在网上找到的关于折刀的漂亮文章: https //www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf


1
除非我弄错了(而且我很可能是这样),否则您的第一个上下文描述了留一法交叉验证
亚历克西斯

2
我只是将使用LOO估算参数的想法与估算遗漏的值(如LOOCV)分开。我将它们视为两个相关但略有不同的过程,但也许两者都可以称为LOOCV?我也可能会误会。
jcmb
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.