1
如果“ .632规则”中的概率不相等怎么办?
此问题源于有关“ .632规则”的问题。我在编写时特别参考了user603的回答/表示,以简化事情。 该答案以大小为的样本开始并从集合(称为)N的不同项中进行替换。第样本与N 的特定元素不同的概率为n,n,n,nnnithithi^{th}sisis_immm(1−1/n).(1−1/n).(1 - 1/n). 在该答案中,N的所有元素都有被随机抽取的同等机会。 我的问题是:假设在上面的问题中要绘制的项目是按正态分布的。也就是说,我们将标准正态曲线从细分为,细分为(例如)100个等长子区间。N中的100个项目中的每一个都有被绘制的概率,该概率等于曲线在其相应间隔中所占的面积。Z=−4Z=−4Z = -4Z=4Z=4Z = 4 我的想法如下: 我的推理与链接答案中的推理类似。的概率,与 N的元素,是其中是绘制的概率si≠msi≠ms_i \ne mmmmP(si≠m)=(1−Fi)P(si≠m)=(1−Fi)P(s_i \neq m) = (1 - F_i)FiFiF_isi.si.s_i. 特定元素m在大小为n的样本S中的概率为 P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m \in S) = 1 - P(m \notin S) = 1 - \prod_1^n P(s_i \neq m) =1−∏1n(1−Fi).=1−∏1n(1−Fi). = 1 - \prod_1^n(1 - F_i). 计算似乎表明,随着子间隔的长度变小,答案收敛到与第一种情况相同的数字(概率都相等)。sisis_i (对我而言)这似乎是违反直觉的,因为该构造似乎会抛出N的元素,而这些元素很少见,因此我希望数字小于.632。 而且,如果这是正确的,我想我们会 …