您没有说其他统计书是什么,但我想这是一本关于有限总体抽样的书(或本节)。
当您对随机变量进行采样时,即当考虑n个随机变量的集合
时,您知道如果它们是独立的,则f (x 1,… ,x n)= f (x 1)⋯ f (x n)且分布相同,特别是E (X i)= μ和Var (X i)X1个,… ,XññF(x1个,… ,xñ)= f(x1个)⋯ f(xñ)Ë(X一世)= μ对所有我,则:
¯ X = Σ 我X 我瓦尔(X一世)= σ2一世
其中σ2是第二中心矩。
X¯¯¯¯= ∑一世X一世ñ,Ë(X¯¯¯¯)= μ ,瓦尔(X¯¯¯¯)= σ2ñ
σ2
对有限的总体进行采样有些不同。如果总体大小为,则在不进行替换的抽样中有( NN大小为n的可能样本si,它们是等概率的:
p(si)=1(Nn)sin
例如,如果Ñ=5和Ñ=3,样品空间是{小号1,...,š10}
和不可能性样品是:
小号1 ={1,2,3}, š 2 ={1,2,4}, š 3 ={1,2,5}, š 4
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}
如果算上每个单独的出现次数的数量,可以看到,他们是6,即,每个个体具有被选择的同等chanche(6/10)。因此,根据第二个定义,每个
si是一个随机样本。大致来说,这不是iid随机样本,因为个体不是随机变量:您可以通过样本均值来一致地估计
E[X],但永远不会知道其确切值,但是如果
n=N,则
可以知道确切的总体均值(让我再说一遍:大概。)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1
μn<Nμ
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
Var(y¯¯¯s)=σ~2n(1−nN)
σ~2∑Ni=1(yi−y¯¯¯)2N−1(1−n/N)
这是一个简单的例子,说明(随机变量)id随机样本和(有限总体)随机样本可能如何不同。统计推断主要是关于随机变量抽样,抽样理论是关于有限总体抽样。
1并解释一组灯泡作为(随机变量)样本。现在说,您发现有一个装有1000个灯泡的盒子,希望知道它们的平均寿命。您可以选择一小组灯泡(一个有限的样本),但是您可以全部选择。如果选择较小的样本,则不会将灯泡转换为随机变量:随机变量由您生成,因为“全部”和“少量样本”之间的选择取决于您。但是,当有限的人口非常大时(例如您所在的国家/地区的人口),当选择“全部”不可行时,第二种情况最好作为第一种解决。