插入符号重采样方法


20

我正在使用caretR中的库来测试各种建模过程。

trainControl对象允许指定一种重采样方法。所述方法在被描述的文档部分2.3,其中包括:bootboot632cvLOOCVLGOCVrepeatedcvoob。尽管其中一些方法易于推断,但并非所有这些方法都明确定义。

这些重采样方法对应的程序是什么?


文档链接已损坏。改用
vikas

Answers:


20

好的,这是我的尝试:

  • 引导-引导程序
  • boot632-0.632 引导程序
  • cv-交叉验证,可能是指K折交叉验证
  • LOOCV-留一法交叉验证,也称为折刀。
  • LGOCV-离开小组出站交叉验证,LOOCV的变体,用于分层数据。
  • repeatcv-可能是重复的随机子采样验证,即以随机方式完成训练和测试数据的划分。
  • oob-指Breiman提出的袋外估计,进一步与自举聚合有关。(链接中的文件不是ps文件,而是ps.Z文件,将其重命名然后尝试打开。)

1
我相信LGOCV是在训练集和验证集之间随机划分的,重复了n次。因此,该过程重复了很多次,而不是通常的情况,即在一次训练和保持之间拆分数据(在火车上建立模型并在保持上进行验证)一次。
B_Miner 2011年

3
我也相信重复CV是多次折叠的k倍交叉验证。
B_Miner 2011年

很难相信这没有记录在某处。
安德鲁

4

repeatedcv按照最大库恩的演讲重复10倍交叉验证肯定。默认的重采样方案是引导程序。

您可以查看有关重采样方法的一个好文件,是使用R和插入符号包pdf)进行的预测建模。Max在“ useR!2013”​​中提出了这一点。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.