非随机样本的随机化


10

我总是对参加实验研究的心理广告感到惊讶。可以肯定的是,对这些广告做出回应的人们并不是随机抽样的,因此是一个自我选择的人群。

因为众所周知,随机化解决了自选问题,所以我想知道非随机样本的随机化是否真的改变了一切。

你怎么看 ?而且,我们应该基于大量自选样本对所有这些心理实验做些什么?


Answers:


10

非随机样本中的随机化仍然可以通过随机变异合理地解释其效果。

例如,假设我们有一个人口,其中有两个未被识别的亚组(特征有些不同*),它们的大小大致相等,但是您的样本是非随机的,分为80/20。让我们想象两个相等大小的治疗组。随机化(至少在样本量合适的情况下)将倾向于在每组中接近80/20的比例,因此治疗效果是由于治疗引起的,而不是异种基团分配给治疗的分配不均。

*得出不同的基准均值

当您想将推断扩展到某些目标人群而不是样本所代表的对象(自选择器)时,就会出现问题。这需要您可能没有证据的假设/论据(例如假设说治疗差异对所有人口子集都是一致的)。

对于类似的情况,可以想象与标准治疗和安慰剂相比,仅在男性身上测试一种高血压药物。假设将男性适当地随机分为治疗组。从某种意义上说,治疗效果是真实的,因为它确实描述了男性的效果。当试图将这种推论推广给女性时,困难就会来了。

因此,如果对这些人员进行适当的安排,并且招募人员以外进行随机分配,那么所观察到的显着效果将是表面上的效果,但这将适用于您实际采样的内容,不一定适用于您想要的目标-跨越两者之间的鸿沟需要仔细的论证;这种论点经常不存在。

当我还是一个学生时,对心理学学生进行心理学实验是很普遍的,他们被要求自愿参加一定时间的此类实验(情况可能仍然如此,但我没有与心理学家进行定期接触谁再做实验)。通过对治疗的随机化,这些推论可能是有效的(取决于所做的事情),但适用于本地自选心理学专业的大学生(因为他们通常选择要参加的实验),这些人与广泛人群的随机样本。


招收贫困的本科生仍然是惯例。期望心理学生参加这样的研究是对研究完整性的严重侵犯,IMO。
StasK 2015年

@StasK:为什么?我曾经发现它们很有趣,并且我想参加这些活动会对心理学专业的学生有帮助。
Scortchi-恢复莫妮卡

1
是的,“介绍性精神库”模型仍然存在并且很好。@StasK,为了使其具有更少的强制性,仅要求学生参加一些实验,他们可以选择哪个实验。我认为我们还有一些让学生选择退出整个过程的方法。
马特·克劳斯

2
如今,人们也对Amazon的Mechanical Turk,Google消费者调查以及其他一些“云”事物感到疯狂。从理论上讲,这些使您可以访问其他主题库,但是那里也存在很多问题(“条件”的可变性更大,主题的动机可能更少,并且您无法真正知道他们是否是他们所说的人...)。本科生就在那里,有足够的动力去做实验,并且经常愿意以便宜的价格工作。
马特·克劳斯

@MattKrause:在我这一天,你会被抽奖来买一瓶酒-从来没有缺少志愿者。
Scortchi-恢复莫妮卡

6

因为众所周知,随机化解决了自选问题,所以我想知道非随机样本的随机化是否真的改变了一切。

简而言之,没有。这样想:您的骨灰盒里有100个黑球和100个白球。您从中采样90个黑球和10个白球。抽样随机从这个子样本不会让你在瓮本身偏见的推理。

而且,我们应该基于大量自选样本对所有这些心理实验做些什么?

人们同意非随机采样是一个问题。但是,问题的多少也与您感兴趣的机制的“理论”有关。如果您的假设所涉及的机制对于所有人类来说基本上都是相同的(即浸入冰冷时会感觉到冰冻的感觉)水),那么非随机选择就没那么重要了。不幸的是,这通常不是我们感兴趣的东西。


心理学家们在问类似的问题:“如果我想通过将球扔在墙上而不是将其放在桌子上然后用锤子击打来打破球,哪个程序更可能将球劈开?” 他们没有尝试推断每种颜色的球的数量,而是就破坏模式进行了推断,涉及到该模式的随机化。
StasK 2015年

不一定,斯塔斯。在某些情况下(例如Stroop效应),目的是推广到所有人类固有的认知机制。即使我们正在比较治疗方法,样本内随机化也不会允许对种群的无偏推论(这正是我们感兴趣的)。
abaumann 2015年

1

有一种用于解决您提到的问题的技术,称为Bootstrapping。自举是一种方法,您可以通过替换实际样品池中的图纸来生成新的合成样品 然后,您可以对每个合成样本池进行统计,并比较各组之间的统计。

由于这些合成样本来自已知的分布,因此具有强大的优势,允许您在统计信息中使用大量其他工具。然后,您可以确定您的估算器在处理这些综合案例方面的表现如何。如果您发现所有合成样本的估计量都能很好地收敛到相同的结果,则自举假设可让您推断出,将估计量应用于完整样本后,可以为未知总体提供良好的估计量。另一方面,如果您发现估算器产生的结果与合成样本集和合成样本集有很大不同,则应该推断出,将估算器应用于完整样本时,可能无法为未知总体提供非常好的估算。

这种自举方法可用于验证非随机样本的随机化是否足够。当然,它不能证明这一点,但是它被用作通过仔细检查随机抽样足够随机的假设来增强可信度的工具。


2
引导假设您的样本与总体非常相似。如果您的样本不能代表总体,则引导过程将无用。因此,我不确定引导程序如何解决非随机样本的问题。
穗高2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.