基于交叉验证(CV)的预测间隔


19

在课本和youtube讲座中,我学到了很多关于诸如boosting之类的迭代模型的知识,但是我从未见过关于推导预测间隔的任何知识。

交叉验证用于以下目的:

  • 型号选择:尝试不同的型号,然后选择最合适的型号。如果是升压,请使用CV选择调整参数。
  • 模型评估:估算所选模型的性能

几个参数对于模型评估很重要,其中之一是预期的预测误差。交叉验证可以很好地估计预测误差,正如《统计学习的要素》一书中所述。

但是,我们如何使用预期的预测误差来建立预测间隔?

例如,如果您预测房屋价格,则500.000欧元房屋的预测间隔将比200.000欧元房屋的预测间隔高。我们如何使用交叉验证来估计这些预测间隔?


这是朝着正确
Kasper

我认为您正在寻找的是保形预测。请参阅Shafer和Vovk的论文jmlr.csail.mit.edu/papers/volume9/shafer08a/shafer08a.pdf
Alexey Zaytsev '02

您能否解释一下为什么您认为500k的房子的预测间隔会比200k的房子“更高”?那是样本数量的函数吗?您可以假设样本是从总分布中抽取的吗?
justanotherbrain

Answers:


3

在再次阅读了这个问题之后,我可以给您以下界限:

假定样品绘制IID,分配是固定的,并且损耗为界,然后用概率至少1 - δë [ Èħ ] Èħ + 1个-δ

Ë[ËH]Ë^H+日志1个δ2

其中,是样本大小,1 - δ是置信度。麦克迪亚米德的不等式微不足道。1个-δ

为样本大小, ë [ Èħ ]是泛化误差,和 Èħ 为假设的测试错误。Ë[ËH]Ë^H

请不要报告交叉验证错误,也不报告测试错误,因为它们只是点估计,所以它们通常没有意义。


记录的旧帖子:

我不确定我是否完全理解您的问题,但是我会采取行动。

首先,我不确定如何为模型选择定义预测间隔,因为据我所知,预测间隔会做出一些分布假设。取而代之的是,您可以得出浓度不等式,该浓度不等式实际上是由随机变量的方差来限制的。在整个机器学习过程中都使用了浓度不等式,其中包括高级理论。在这种情况下,您要用经验误差(测试集上的误差)加上一些复杂度项和一个与方差有关的项来限制泛化误差(通常来说,您没有看到的误差)。

现在,我需要消除对交叉验证的误解,这种误解是非常普遍的。交叉验证只会为您提供针对固定样本大小的模型预期误差的无偏估计。此证明仅适用于遗忘协议。这实际上是相当弱的,因为它没有提供有关方差的信息。另一方面,交叉验证将返回与结构风险最小化解决方案接近的模型,这是理论上最好的解决方案。您可以在以下附录中找到证明:http : //www.cns.nyu.edu/~rabadi/resources/scat-150519.pdf

那么,如何得出一个泛化界呢?(记住泛化界限基本上是关于特定模型的泛化误差的预测间隔)。好吧,这些界限是特定于算法的。不幸的是,只有一本教科书为机器学习(包括加速)中所有常用算法设定了界限。该书是Mohri,Rostamizadeh和Talwalkar撰写的《机器学习基础》(2012年)。对于涵盖该材料的讲座幻灯片,您可以在Mohri的网页上找到它们:http : //www.cs.nyu.edu/~mohri/ml14/

尽管《统计学习的元素》是一本重要且颇有帮助的书,但它并不十分严格,它省略了有关算法的许多非常重要的技术细节,并完全省略了任何形式的概括界限。《机器学习的基础》是一本关于机器学习的最全面的书(这看起来是有道理的,因为它是由该领域的一些顶尖人士撰写的)。但是,教科书是高级的,因此请提防技术细节。

可以在此处找到(带有证明)促进提升的概括:http : //www.cs.nyu.edu/~mohri/mls/lecture_6.pdf

我希望这些足以回答您的问题。我不愿给出完整的答案,因为它将花费大约50页才能浏览所有必要的细节,更不用说初步讨论了。

祝好运!


因此,据我所知,这为整个分位数(基于某些假设)的任何分位数的泛化误差提供了上限。但是,我不理解您的句子“请不要报告交叉验证错误或测试错误”。您是说这两项措施无用还是只是徒劳地寻找预测间隔?
LouisBBBB

@LouisBBBB CV错误和测试错误有点像报告样本均值。在没有某种置信区间的情况下报告样本均值通常是一种不好的做法,因为每次我运行实验时,我都会得到不同的结果。我说的是无意义的,但也许“无用的”更好。。。有人可能会说点估计(即定义)中有一些意义。但是总的来说,点估计在没有以“有用的方式”表征错误分布的意义上是“无用的”。在做出决策时“有用”。
justanotherbrain

我想我明白你的意思。因此,您更喜欢分析误差的分布而不是均值。而且,如果我回到问题上,Kasper希望估计“每点”的预测间隔。您的答案是预测间隔长度(或近似值)的全局上限,对吗?那么,您知道一种获取局部上限的方法吗?
LouisBBBB

啊-感谢您的澄清。我想我误解了@Kasper的问题,并且有很多后续问题。感谢您指出这一点,我会做一些挖掘。
justanotherbrain
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.