在两个非重叠人群(患者和健康人群,总计)的数据集中,我想(从独立变量中)找到连续因变量的重要预测因子。存在预测变量之间的相关性。我有兴趣了解是否有任何预测变量与“现实中”的因变量相关(而不是尽可能准确地预测因变量)。当我对众多可能的方法不知所措时,我想问一问最推荐哪种方法。
根据我的理解,不建议逐步加入或排除预测变量
例如,对每个预测变量分别运行线性回归,并使用FDR校正p值以进行多次比较(可能非常保守?)
主成分回归:难以解释,因为我无法讲述单个预测变量的预测能力,而只能讲述成分。
还有其他建议吗?