我遇到了一项研究,其中对50岁以上的患者按出生年份进行了伪随机分组。如果出生年份是偶数,则通常护理,如果是奇数,则进行干预。
它更容易实现,更难颠覆(很容易检查病人应该接受的治疗),很容易记住(任务进行了数年)。但是,我仍然不喜欢它,我觉得适当的随机化会更好。但我无法解释原因。
我是否感觉错了?还是有充分的理由倾向于“真正的”随机化?
我遇到了一项研究,其中对50岁以上的患者按出生年份进行了伪随机分组。如果出生年份是偶数,则通常护理,如果是奇数,则进行干预。
它更容易实现,更难颠覆(很容易检查病人应该接受的治疗),很容易记住(任务进行了数年)。但是,我仍然不喜欢它,我觉得适当的随机化会更好。但我无法解释原因。
我是否感觉错了?还是有充分的理由倾向于“真正的”随机化?
Answers:
您对此表示怀疑是正确的。通常,应该使用“真实”随机方法,因为通常情况下,人们对相关因素(不可观察的事物)一无所知。如果这些不可观察者之一与奇数或偶数年龄相关,那么它也与他们是否接受过治疗相关。如果是这种情况,我们将无法确定治疗效果:我们观察到的效果可能是由于治疗,还是由于未观察到的因素。
对于真正的随机化而言,这不是问题,在这种情况下,我们不希望治疗与不可观察性之间有任何依存关系(当然,对于小样本而言,可能就存在这种依赖关系)。
为了构建一个说明为什么这种随机化程序可能会引起问题的故事,假设该研究仅包括例如越战爆发时17/18岁的受试者。拥有17岁的人没有机会起草(如果我错了,请纠正我),而拥有18岁的人有机会。假设这个机会是不可忽略的,战争经验改变了人们,这意味着几年后,这两个群体即使相隔仅一年,也有所不同。因此,也许这种治疗(药物)看起来不起作用,但是因为只有越南退伍军人才能得到治疗,这实际上可能是由于它不适用于PTSD患者(或其他与成为老将)。换句话说,除了治疗以外,您需要两组(治疗组和对照组)相同,以识别治疗效果。
因此,除非您可以排除两组之间没有观察到的差异(但是,如果没有观察到该怎么办?),则最好使用真正的随机方法。
不时坚持反对派观点是一个很好的练习,因此,让我从提供支持这种形式的伪随机化的几个理由开始。 从原则上讲,它们与任何其他形式的系统采样都没有什么不同,例如在田野某个网格点获取环境介质采样或对果园中的每棵其他树木进行采样,因此这种采样可能具有可比的优势。 。
这里的类比是完美的: 年龄是从零开始的,按年份“固定”,并沿该(一维)网格交替分配组。这种方法的一些优点是可以保证样品在田间或果园(在这种情况下为年龄)的广泛均匀分布,这有助于消除与位置(或时间)有关的影响。当理论认为位置是响应变化的主要因素时,这可能特别有用。此外,除了非常小的样本外,分析数据就像它们是一个简单的随机样本,引入的误差相对较小。此外,可以进行一些随机化:在现场,我们可以随机选择网格的原点和方向。在当前情况下,我们至少可以随机化偶数年是对照组还是治疗组。
网格采样的另一个优点是可以检测局部变化。 在现场,这将是异常反应的“口袋”。从统计上讲,我们可以将它们视为空间相关性的体现。 在目前的情况下,如果某个相对狭窄的年龄范围有可能出现异常反应,那么网格设计是一个不错的选择,因为纯随机设计可能偶然地在一个组中包含较大的年龄差距。(但更好的设计可能是分层:使用年龄平等来形成两个分析层次,然后在每个层次内独立地将患者随机分为对照组和治疗组。)
不幸的是,一旦我们对年龄的实际报告方式达成共识,这种防御就会瓦解。美国人口普查数据显示:(1)自我报告的年龄趋于四舍五入(我在农村街区分组数据的分析中已经看到),并且(2)这种趋势与低学历或社会经济地位的指标有关。(众所周知,尽管很难测试,但在许多自我报告的年龄中,最后一位数字是;在某些工作领域(例如表演)的人倾向于减少其报告的年龄,而其他人则会夸大他们的年龄因此,至少在美国的某些地区(甚至在世界其他地区甚至更多),至少在某种程度上,一个人报告的年龄很可能是同等的与对实验重要的因素有关。这使得问题中的关注点少于假设的关注点:这是真实的。在这一点上,该主题中的先前答案很可能会提出我将要提出的其他想法,因此,我将停止并邀请您重新阅读它们。
我同意您所举的例子是无害的,但是...
如果所涉及的代理(进行干预的人员或进行干预的人员)意识到分配方案,则可以利用该方案。这种自我选择应该很明显,为什么在大多数实验设计中都会出现问题。
我在犯罪学中知道的一个例子就是这样。该实验旨在测试国内纠纷后在监狱中过夜的威慑作用,而不是仅仅要求肇事者过夜。官员们得到了一本小册子,上面的当前工作表的颜色是为了确定对病人的治疗。在特定事件中本应收到。
最终发生的事情是军官有意违抗研究设计,并根据个人喜好选择了一张纸,以应对刺杀者。怀疑在您的示例中至少有可能进行类似的多年摸索并非非同寻常。