控制和治疗之间的差异应该显式还是隐式建模?


9

给出以下实验设置:

从受试者中采集多个样品,并对每个样品进行多种处理(包括对照治疗)。主要有趣的是对照和每种处理之间的差异。

我可以为这个数据想到两个简单的模型。以样本,处理,处理0为对照,令为数据,为样本的基线,为处理的差。第一个模型同时考虑了控制和差异:ijYijγiiδjj

Yij=γi+δj+ϵij
δ0=0

虽然第二种模型仅着眼于差异。如果我们预先计算预先 然后 dij

dij=YijYi0
dij=δj+εij

我的问题是这两种设置之间的根本区别是什么?尤其是,如果这些级别本身没有意义,而只有差异很重要,那么第一个模型是否做得太多并且动力不足?


2
稍后我可以给出更详尽的答案,但我建议Paul Allison撰写的这篇论文会引起人们的兴趣(Allison,1990年)。
安迪W

1
编辑以反映不同模型中的错误实际上并不相同的事实,因此不应使用相同的符号。
罗南·戴利2011年

Answers:


6

ϵij 可能在第二个模型中相关,而在第一个模型中不相关。

首先,这些术语表示测量误差和与附加模型的偏差。通过合理的谨慎-例如通过随机化测量顺序-可以在模型准确时使这些误差独立。何处

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(请注意,这与问题中的最后一个方程式相矛盾,因为假设是错误的 ϵi0=0。这样做将迫使我们承认γi是随机变量而不是参数,至少在我们确认控件存在测量误差的可能性之后。这将导致以下相同的结论。)

对于 j,k0jk 这意味着

CØvd一世Ĵd一世ķ=CØvϵ一世Ĵ-ϵ一世0ϵ一世ķ-ϵ一世0=V一个[Rϵ一世00。

相关性可以是实质性的。对于iid错误,类似的计算表明它等于0.5。除非您使用显式且正确地处理此关联的过程,否则请优先使用第一种模型。


因此,您假设第一个模型是真实模型,并得出了第二个模型的不良属性。我们知道所有模型都是错误的,所以这个结果真的有意义吗?

1
@Macro请更仔细地阅读我的回答:旨在说明需要哪些假设来证明第一个模型是合理的并将其与第二个模型区分开,但不包含任何模型为“真”的假设。例如,请注意“模型正确时”的警告。甚至选择“准确”一词也是为了避免误以为存在“真实”或“正确”模型。
ub

1
我有点困惑,什么是 d一世ķ
Andy W

1
@安迪 Ĵķ列出两种不同的治疗方法。我应该写“Ĵķ0......“我会解决这个错字感谢接住。
whuber

@whuber是否有任何引用支持您的陈述,例如说服审稿人?
丹尼尔(Daniel)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.