Answers:
本质上,问题在于显示
(当然,e ^ {-1} = 1 / e \ approx 1/3,至少非常粗略)。
它在很小的n下不起作用-例如在,。它通过在,通过在,和由。一旦超过,比\ frac {1} {3}更好。
灰色虚线位于;红线和灰线位于。
除了展示形式推导(很容易找到)以外,我将概述为什么(略)更普遍的结果成立:
(许多人将其定义为,但是您可以从更简单的结果中证明这一点,例如将定义为。)
事实1:这是关于幂和幂的基本结果的
事实2:当大时,这来自于的级数展开。
(我可以为每个参数提供更全面的论据,但我想您已经知道它们了)
用(1)中的(2)代替。做完了 (要使它作为更正式的论据起作用,将需要一些工作,因为您必须证明事实2中的剩余项不够大,以至于使用幂时会引起问题。但这是直觉而不是形式证明。)
[或者,只需将的泰勒级数设为一阶。第二种简单的方法是采用的二项式展开式,并逐项取极限,表明它给出了。]
因此,如果,只需替换。
马上,我们得到的结果在该答案的顶部,
正如gung在评论中指出的那样,您问题的结果是632引导程序规则的由来
例如看
Efron,B.和R. Tibshirani(1997),
“交叉验证的改进:.632+ Bootstrap方法”,《
美国统计协会学报》,第1卷。92,No。438。(六月),第548-560页
更准确地说,每个引导程序样本(或袋装树)将包含的样本。
让我们看看引导程序是如何工作的。我们有一个原始样本其中包含项目。我们从原始集合中抽取带有替换项的项目,直到我们得到另一个大小为集合。
,在第一抽奖中选择任何一项(例如)的可能性为。因此,不选择该项目的可能性为。那只是第一次抽奖;总共有抽签,所有抽签都是独立的,因此从不选择任何抽签的项目的概率为。
现在,让我们考虑一下当越来越大时会发生什么。我们可以使用通常的演算技巧(或Wolfram Alpha),随着趋于无穷大而取极限:
那就是没有选择一项的可能性。将其减去一个,即可找到被选中项目的概率,得出0.632。
通过计数很容易看出这一点。总共可能有多少个样本?n ^ n。多少个不包含特定值?(n-1)^ n。没有特定值的样本的概率-(1-1 / n)^ n,约为极限值的1/3。