虽然我觉得有点不好意思矛盾既是“尊重文本”以及其他CV用户,这在我看来,斯皮尔曼-布朗公式不会受具有不同难度的项目。可以肯定的是,Spearman-Brown公式通常是在我们有平行项目的假设下得出的,这意味着(除其他事项外)这些项目具有相同的难度。但是事实证明这种假设是没有必要的。它可以放宽以允许不平等的困难,而Spearman-Brown公式仍然适用。我在下面演示这一点。
回想一下,在经典测试理论中,度量假定为“真实分数”分量和误差分量的总和,即
且和不相关。平行项目的假设是,所有项目都具有相同的真实分数,只是它们的误差成分不同,尽管它们被假定具有相同的方差。在符号中,对于任何一对项目和,
XTE
X=T+E,
TEXX′T=T′var(E)=var(E′).
让我们看看放宽第一个假设时会发生什么,从而使项目的难度可能有所不同,然后在这些新假设下得出总测试成绩的可靠性。具体来说,假设真实分数可能相差一个加性常数,但误差仍然具有相同的方差。在符号中,
难度的任何差异都可以通过加性常数来捕获。例如,如果,则分数往往高于上的分数,因此比 “容易” 。我们可以称它们为
基本平行T=T′+c′var(E)=var(E′).
c′>0XX′XX′类似于“基本tau等效性”的假设,它以类似的方式放宽了tau等效模型。
现在得出此类项目的测试表格的可靠性。考虑一个由基本平行的项目组成的测试,其总和给出测试分数。根据定义,可靠性是真实分数差异与观察分数差异的比率。对于单个项目的可靠性,从基本并行性的定义可以得出,它们具有相同的可靠性,我们用,其中是真实分数方差,是误差方差。为了确保总考试成绩的可靠性,我们首先检查总考试成绩的方差,即
kρ=σ2T/(σ2T+σ2E)σ2Tσ2E Ťσ 2 Ť σ 2 ë ķ 2 σ 2 Ť
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
其中(无下标)为任意的真实分数,所有的项目真分数可以通过它们的常数项被移动到,是真实分数方差,是误差方差。请注意,常数项会消失!这是关键。因此,总测试分数的可靠性为
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
这只是经典的Spearman-Brown公式,未更改。这表明即使改变项目的“难度”(定义为它们的平均分数),Spearman-Brown公式仍然成立。
@JeremyMiles提出了一些有趣和重要的观点,说明了当我们在“真实世界”中增加测试长度时会发生什么,但是至少根据经典测试理论的理想假设,项目难度的变化与测试可靠性无关紧要。测试形式(与现代项目响应理论的假设形成鲜明对比!)。这条相同的基本推理路线也是为什么我们通常讲本质的 tau等效而不是tau等效的原因,因为大多数重要结果都适用于项目难度(即均值)可能不同的更为宽大的情况。