反复测试累积数据时出现总体I型错误


12

我对组顺序方法有疑问。

根据维基百科:

在具有两个治疗组的随机试验中,按以下方式使用经典组顺序测试:如果每个组中有n位受试者可用,则对2n位受试者进行中期分析。进行统计分析以比较两组,如果接受替代假设,则终止试验。否则,将继续试验另外2n名受试者,每组n名受试者。再次对4n名受试者进行统计分析。如果接受了替代方案,则审判终止。否则,它将继续进行定期评估,直到N组2n个主题可用为止。此时,将进行最后一次统计检验,并且该试验将终止

但是通过以这种方式反复测试累积数据,I型错误级别被夸大了……

如果样本彼此独立,则总的I类错误将为α

α=1(1α)k

其中是每个测试的级别,是临时外观的数量。αk

但是样本不是独立的,因为它们重叠。假设以相等的信息增量执行临时分析,则可以发现(幻灯片6)

在此处输入图片说明

您能解释一下该表格的获取方式吗?

Answers:


12

下面的幻灯片,直到第14张,解释了这个想法。您要注意的是,统计序列是相关的。

上下文是具有已知标准偏差的z检验。经过适当标准化的第一个测试统计量具有cdf的Normal(0,1)分布。第二个统计量,但是-因为第一个统计量使用的是第二个统计数据的子集,所以这两个统计量与相关系数。因此具有双正态分布。I型错误的概率(在原假设下)等于(a)在第一次测试中发生I型错误或(b)在第一次测试中未发生但在I型错误中发生的I型错误的概率。第二次测试。令z1Φz21/2(z1,z2)c=Φ1(10.05/2)为临界值(对于名义尺寸 = 0.05 的双向测试)。然后,经过两次分析,出现I型错误的机率等于的机率或和。数值积分得出该概率值为0.0831178,与表格一致。该表中的后续值是通过类似的推理(以及更复杂的积分)获得的。α|z1|>c|z1|c|z2|>c

此图显示了双向法线pdf和积分区域(固体表面)。 双标准PDF,3D表面图


明白了,谢谢!相关cor(z1,z2)难于获得吗?
ocram 2011年

@Marco,相关性很容易计算,因为测试统计非常简单:它是普通变量的线性组合。(这是因为我们假设方差是已知的。)或者,您可以将第二个统计量视为两个独立随机变量的和:第一个统计量,加上由附加数据创建的变化。在更复杂的情况下,相关性可能很难计算:这就是这种稍微理想化的情况用于激发顺序测试的原因之一!z 1z 2z1z1z2
ub

非常感谢你。是的,相关看起来很容易计算。实际上,我不清楚上下文是否是两个正态分布均值的比较。现在,这很清楚了,您也使其他所有事情都变得很清楚了!谢谢!
ocram 2011年

您能否提供一个公式(或R代码),例如,如何计算n = 400?我自己一个人做,可惜我不知道怎么做。如果要进行多次比较(例如,比较4个比例)并且不进行Bonferroni之类的校正并进行重复测试,那么要计算总体错误率,该如何调整公式?你能帮我吗?
Andreas
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.