让由ķ -维随机向量,随机变量,即一个固定位置集合(可测量实际的函数)。x =( X1个,。。。,XĴ,。。。,Xķ)k −
考虑许多这样的载体,说和索引这些载体由我= 1 ,。。。,n,所以说ñ我= 1 ,。。。,n
并把它们作为一个所谓的“样品”,收集小号=( X 1,。。。, X我,。。。, X ñ)。然后,我们调用每个ķ-
X一世= (X1 我,。。。,XĴ 我,。。。,Xķ 我)
小号= (x1个,。。。,X一世,。。。,Xñ)k − 维向量是一种“观测”(尽管只有在我们测量并记录所涉及的随机变量的实现后,它才真正成为观测)。
首先,考虑存在概率质量函数(PMF)或概率密度函数(PDF)以及联合这些函数的情况。用关节PMF或每个随机向量的联合PDF,和 ˚F (X 1,。。。,X我,。。。,X Ñ)所有这些矢量的关节PMF或联合PDF在一起。 F一世(x一世),我= 1 ,。。。,nF(x1个,。。。,X一世,。。。,Xñ)
然后,如果以下数学等式成立,则样本被称为“独立样本”:小号
F(x1个,。。。,X一世,。。。,Xñ)= ∏我= 1ñF一世(x一世),∀ (X1个,。。。,X一世,。。。,Xñ)∈ d小号
其中 是由n个随机向量/观测值创建的联合域。d小号ñ
这意味着“观察”是“共同独立的”(在统计学意义上,或“在概率上独立”,就像今天仍然有时听到的那句老话)。习惯是简单地称它们为“独立观察”。
请注意,此处的统计独立性属性超出索引,即在观察之间。它与每个观察值中的随机变量之间的概率/统计关系是什么无关(在一般情况下,我们在这里对待每个观察值都是多维的)。一世
还要注意,在我们有无密度的连续随机变量的情况下,上述值可以用分布函数表示。
这就是“独立观察”的意思。它是用数学术语表达的精确定义的属性。让我们看看它的含义。
独立观测的一些后果
答:如果两个观测值是一组共同独立观测值的一部分,那么它们也是“成对独立的”(统计上),
F(x一世,X米)= f一世(x一世)˚F米(x米)∀ 我≠ 米,我,米= 1 ,。。。,n
这反过来意味着有条件的PMF / PDF等于“边际”的
F(x一世∣ x米)=f一世(x一世)∀ 我≠ 米,我,米= 1 ,。。。,n
例如,这可以归结为许多有条件或有条件的论点
f(xi,xℓ∣xm)=f(xi,xℓ),f(xi∣xm,xℓ)=fi(xi)
等等,只要左侧的索引与垂直线右侧的索引不同即可。
这意味着如果我们实际上观察到一个观察值,则表征该样品的任何其他观察值的概率不会改变。因此,关于预测,独立样本不是我们最好的朋友。我们希望有依赖性,以便每个观察都可以帮助我们说出更多关于其他观察的信息。
B.另一方面,独立样本具有最大的信息含量。每个观察值都是独立的,其信息不能完全或部分地由样本中的任何其他观察值推断。因此,与任何在某些观察值之间存在一定统计依赖性的可比较样本相比,总和最大。但是,如果这些信息不能帮助我们改善我们的预测,那么它有什么用呢?
好吧,这是关于表征样本中随机变量的概率的间接信息。如果我们的样本是独立的,则这些观察结果具有共同特征的次数越多(在我们的案例中是常见的概率分布),我们就越有能力发现它们。
换句话说,如果样本是独立的且 “分布相同”,则表示
fi(xi)=fm(xm)=f(x),i≠m
为了获得不仅关于共同的联合概率分布,而且关于构成每个观测值的随机变量的边际分布的信息,例如f j(x j i),这是最好的样本。 f(x)fj(xji)
因此,即使,对于x i的实际实现,对于零的附加预测能力,使用独立且分布均匀的样本,我们仍将处于最佳状态函数f i(或其某些属性),即边际分布。f(xi∣xm)=fi(xi)xi fi
因此,至于估计(有时作为一个包罗万象的术语,但在这里它应保持的概念截然不同的预测),一个独立的样本是我们的“最好的朋友”,如果它与“同分布相结合”属性。
C.由此得出结论,一个独立的观察样本(每个样本的特征是完全不同的概率分布,没有任何共同特征)是一个人所能获得的毫无价值的信息集合(当然,每条信息本身都是值得一提的是,这些问题加在一起无法提供任何有用的信息)。想象一个样本,其中包含三个观测值:一个包含南美的水果(具有定量特征),另一个包含欧洲的山脉,第三个包含亚洲的衣服。这三个部分都很有趣,但作为一个样本,对我们而言在统计学上没有任何用处。
换句话说,独立样本有用的必要和充分条件是观测值具有一些共同的统计特征。这就是为什么在统计中,“样本”一词通常不与“信息收集”同义,而是“与具有某些共同特征的实体有关的信息收集”。
在OP的数据示例中的应用
响应用户@gung的请求,让我们根据上述内容检查OP的示例。我们可以合理地假设我们所在的学校有两名以上的老师和六名以上的学生。因此,a)我们同时对学生和教师进行抽样,b)我们在数据集中包括与每种师生组合相对应的成绩。
即,成绩不是 “抽样”的,而是我们对教师和学生进行抽样的结果。因此,将随机变量(=年级)视为“因变量” 是合理的,而学生(P)和教师T是“解释性变量”(并非所有可能的解释变量,仅一部分)。我们的样本包括六个观察,我们明确地写出,小号= (小号 1,。。。,s ^ 6)作为GPTS=(s1,...,s6)
s1=(T1,P1,G1)s2=(T1,P2,G2)s3=(T1,P3,G3)s3=(T2,P4,G4)s4=(T2,P5,G5)s5=(T2,P6,G6)
PiGi
T1,T2
s1,s2,s3T1s4,s5,s6T2
请仔细注意“相同的随机变量”和“具有相同分布的两个不同的随机变量”之间的区别。
s1,s2,s3T1s4,s5,s6T2
现在假设我们从样本中排除了随机变量“老师”。是六个观测值的(样本,等级)样本,是独立样本吗?
在这里,我们将对教师,学生和年级之间的结构关系的假设很重要。
T1T2G1,G2,G3T1
但是要说老师在这方面是相同的。然后,在上述假设“教师影响学生”的情况下,我们又得到前三个观察结果是相互依赖的,因为教师影响了影响成绩的学生,我们得出了相同的结果,尽管在这种情况下是间接的(对于这种情况同样如此)其他三个)。同样,样本不是独立的。
性别案例
GeM,F
s1=(Ge1,P1,G1)s2=(Ge2,P2,G2)s3=(Ge3,P3,G3)s3=(Ge4,P4,G4)s4=(Ge5,P5,G5)s5=(Ge6,P6,G6)
请注意,关于性别的样本描述中包含的并不是每个学生的实际值,而是随机变量“性别”。回头看一下这个很长答案的开始:样本不是定义为数字的集合(或者通常是固定的数值或非值的集合),而是随机变量(即函数)的集合。
Gei1Ge1P2,P3,...不,然后便是观察之间相互依赖的另一个可能来源。最后,一个学生的性别会直接影响另一个学生的成绩吗?如果我们认为不这样做,我们将获得一个独立的样本(以所有具有同一位老师的学生为条件)。