像Z,t和其他几种测试都假定数据基于随机采样。为什么?
假设我正在做实验研究,我在乎内部有效性而不是外部有效性。因此,如果我的样本可能有点偏见,那很好,因为我已经接受了不推断整个人群的假设的结论。并且分组仍将是随机的,即,为了方便起见,我将选择样本参与者,但我将它们随机分配给不同的组。
为什么我不能忽略这个假设?
像Z,t和其他几种测试都假定数据基于随机采样。为什么?
假设我正在做实验研究,我在乎内部有效性而不是外部有效性。因此,如果我的样本可能有点偏见,那很好,因为我已经接受了不推断整个人群的假设的结论。并且分组仍将是随机的,即,为了方便起见,我将选择样本参与者,但我将它们随机分配给不同的组。
为什么我不能忽略这个假设?
Answers:
在真正的科学研究中,很少有来自真正随机抽样的数据。数据几乎总是方便样本。这主要影响您可以概括为的总体。就是说,即使它们是方便样本,但它们确实来自某个地方,您只需要弄清楚其中的隐含位置和局限性即可。如果您真的相信自己的数据不能代表任何事情,那么您的研究就没有任何意义,但是那可能不正确1。因此,通常合理的做法是将您的样品视为从某个地方抽取并使用这些标准测试,至少是在套期或合格的意义上。
但是,存在另一种测试哲学,认为我们应该远离这些假设以及依赖于这些假设的测试。图基倡导了这一点。相反,大多数实验研究被认为(内部)有效,因为研究单位(例如患者)被随机分配到了手臂上。鉴于此,您可以使用置换测试,大多数情况下仅假设随机化已正确完成。对此过多担心的反驳是,置换测试通常会显示与相应的经典测试相同的东西,并且执行的工作更多。同样,标准测试也可以接受。
1.有关这些方面的更多信息,在这里阅读我的答案可能会有所帮助:确定研究中的总体和样本。