如我所见,观察研究存在两个“控制”许多自变量的基本问题。1)您的问题在于缺少解释变量,从而导致模型规格不正确。2)您有多个相关的独立变量的问题-在(精心设计的)实验中不存在的问题-以及协变量的回归系数和ANCOVA检验基于分项的事实,使它们难以解释。第一个是观察性研究的本质所固有的,并且是在科学背景和竞争性阐述过程中解决的。后者是一个教育问题,它依赖于对回归模型和ANCOVA模型的清晰理解,以及这些系数的确切含义。
关于第一个问题,很容易证明,如果对某个因变量的所有影响都是已知的并包含在模型中,则控制的统计方法是有效的,并且可以很好地预测和估计各个变量的影响。“软科学”的问题在于,几乎所有相关影响都很少被包括,甚至不为人所知,因此这些模型的规范性很差,难以解释。然而,在这些领域中存在许多有价值的问题。答案只是缺乏确定性。科学过程的美丽在于它是自我纠正的,并且对模型进行了质疑,阐述和完善。另一种选择是建议我们在无法设计实验时无法科学地研究这些问题。
第二个问题是ANCOVA和回归模型本质上的技术问题。分析人员需要弄清楚这些系数和检验代表什么。自变量之间的相关性影响回归系数和ANCOVA检验。他们是局部测试。这些模型取出与模型中所有其他变量关联的给定自变量和因变量的方差,然后检查这些残差中的关系。结果,在对包括的全部变量及其相互关系的清晰概念理解的上下文之外,很难解释各个系数和检验。但是,这不会产生任何预测问题-谨慎解释特定的测试和系数。
旁注: 当将其他预测变量引入模型时,后一个问题与本论坛先前讨论的关于回归符号反转(例如,从负到正)的问题有关。在存在相关的预测变量的情况下,如果没有清楚地了解整个预测变量集之间的多重和复杂关系,则没有理由期望回归回归系数具有特定的符号。当有很强的理论和对这些相互关系的清楚理解时,这种符号“逆转”将具有启发性并在理论上有用。不过,我希望,鉴于许多社会科学问题的复杂性,对它们的充分理解将是不普遍的。
免责声明: 我是经过培训的社会学家和公共政策分析师。