多元回归和多重比较


10

说我适合p个解释变量的多元回归。t检验将允许我检查如果这些中的任意单个是显著()。我可以进行部分F检验,以检查其中的某些子集是否有意义()。H0β一世=0H0β一世=βĴ==βķ=0

我经常看到的是,某人从5个t检验中获得了5个p值(假设他们有5个协变量),而仅保持p值<0.05。这似乎有点不正确,因为确实应该进行多重比较检查吗?说像和是有意义的但不是,和这样的东西真的很公平吗?β1个β2β3β4β5

在相关说明中,假设我对2个独立模型(不同结果)进行了2个回归。是否需要对两个结果之间的重要参数进行多重比较检查?

编辑: 为了与类似的问题区分开,对p值是否还有其他解释:“在对所有其他协变量进行调整时,B_i是(有效的)”?似乎这种解释并不能让我查看每个B_i并将那些小于0.5的B_i删除(这与另一篇文章类似)。

在我看来,一种确定B_i和Y是否存在关系的肯定方法是为每个协变量获取一个相关系数p值,然后执行multcomp(尽管这肯定会丢失信号)。

最后,假设我计算了B1 / Y1,B2 / Y1和B3 / Y1之间的相关性(因此是三个p值)。无关地,我还在T1 / Y2,T2 / Y2,T3 / Y2之间进行了关联。我假设正确的Bonferroni调整对于所有6个测试一起为6(而不是第一组为3,第二组为3-从而获得2个“半”调整后的p值)。


1
这看起来像是(此问题)[ stats.stackexchange.com/questions/3200/…的副本。如果不是,请说明原因。
彼得·弗洛姆

嗨,相似,但不完全相同。也许更好的问题是,当一个人获得p值列表时,是否可能是以下唯一解释:“控制所有其他参数,此变量为in / significant”。您如何看待所有这些。
user1357015

如果您想编辑问题,那很好,但是最好在问题本身中进行编辑,以便人们首先看到它。但是我不起诉“您对所有这些人的看法如何”的意思。
彼得·富勒姆

Answers:


10

你是对的。多重比较的问题无处不在,但是,由于通常会讲授这种方式,人们只认为它与通过一堆Ť检验相互比较多个组有关。实际上,有很多例子存在多重比较的问题,但是看起来并没有很多成对的比较。例如,如果您有很多连续变量,并且想知道是否有任何关联,那么您将遇到多重比较问题(请参见此处:查找,您将找到一个关联)。

另一个例子是您提出的例子。如果您要使用20个变量进行多元回归,并且使用α=.05作为阈值,那么即使所有空值都是真实的,您也会希望偶然地一个变量是“显着的”。多重比较的问题仅来自进行大量分析的数学问题。如果所有零假设为真,且变量完全不相关的,而不是错误地拒绝的概率任何真正的零。将1个-1个-αp(例如,具有p=5,这是.23)。

FŤ-tests,但会删除所有虚拟代码并改为执行嵌套模型测试。

另一种可能的策略是使用alpha调整过程,例如Bonferroni校正。您应该意识到这样做会降低您的能力,并降低您的家庭式I型错误率。这种权衡是否值得,是您需要做出的判断。(FWIW,我通常不在多元回归中使用alpha校正。)

p

b1个X1个+b2X2b1个X1个+b2X2+b3X3

关于如何处理具有不同因变量的分析的问题,是否要使用某种调整取决于您如何看待彼此之间的分析。传统的想法是确定是否有意义地将它们视为“家庭”。此处讨论:对于“假设族”,什么可能是一个清晰,实用的定义? 您可能还需要阅读以下主题:预测多个因变量的方法


这次真是万分感谢。这正是我所需要的。关于你的遗传论评论。这是有道理的,但是似乎如果我对相关性p值进行保守的Bonferroni校正,即使存在端倪,bonferroni校正也应该不会吗?
user1357015 2013年

Bonferroni校正与内生性无关。如果您的协变量之间完全相关,则单变量XY相关将是该关系的有偏估计。您应该安装要安装的模型并在此停下来。通常,没有任何进一步的实际需求。如果您需要建立一个真实的预测模型,则应使用交叉验证或其他适合的方法。
gung-恢复莫妮卡

0

从实践的角度来看,我认为还需要考虑Beta能否反映类别变量(即虚拟变量)的水平。在这种情况下,有兴趣知道给定Beta与(有意义的)参照Beta是否不同是有道理的。但是,即使在进行成对比较之前,也需要知道分类变量的总体水平是否重要(使用联合F检验或似然比检验)。这样做的好处是使用更少的df

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.