比较两个线性回归模型


12

我想比较两个线性回归模型,它们表示在两种不同条件下,mRNA随时间的降解速率。每个模型的数据都是独立收集的。

这是数据集。

时间(小时)日志(处理A)日志(处理B)
0 2.02 1.97
0 2.04 2.06
0 1.93 1.96
2 2.02 1.91
2 2.00 1.95
2 2.07 1.82
4 1.96 1.97
4 2.02 1.99
4 2.02 1.99
6 1.94 1.90
6 1.94 1.97
6 1.86 1.88
8 1.93 1.97
8 2.12 1.99
8 2.06 1.93
12 1.71 1.70
12 1.96 1.73
12 1.71 1.76
24 1.70 1.46
24 1.83 1.41
24 1.62 1.42

这些是我的模型:

Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
呼叫:
lm(公式= Exp1 $时间〜Exp1 $(处理A))

残留物:
    最小值1Q中位数3Q最大值 
-6.8950 -1.2322 0.2862 1.2494 5.2494 

系数:
                   估计标准 误差t值Pr(> | t |)    
(拦截)74.68 6.27 11.91 2.94e-10 ***
Exp1 $(治疗A)-36.14 3.38 -10.69 1.77e-09 ***
---
签名 代码:0'***'0.001'**'0.01'*'0.05'。0.1''1

残留标准误差:19自由度时为2.97
多个R平方:0.8575,调整后R平方:0.85 
F统计量:在1和19 DF上为114.3,p值:1.772e-09

呼叫:
lm(公式= Exp1 $时间〜Exp1 $(治疗B))

残留物:
   最小值1Q中位数3Q最大值 
-7.861 -3.278 -1.444 3.222 11.972 

系数:
                      估计标准 误差t值Pr(> | t |)    
(拦截)88.281 16.114 5.478 2.76e-05 ***
Exp1 $(治疗B)-41.668 8.343 -4.994 8.05e-05 ***
---
签名 代码:0'***'0.001'**'0.01'*'0.05'。0.1''1

残留标准误差:19自由度上的5.173
多个R平方:0.5676,调整后R平方:0.5449 
F统计量:1和19 DF时为24.94,p值:8.052e-05

为了比较这两种模型,我使用了以下代码。

anova(Exp1.A.lm,Exp1.B.lm)
方差表分析

模型1:Exp1 $ Time〜Exp1 $ Exp1 $(处理A)
模型2:Exp1 $时间〜Exp1 $ Exp1 $(治疗B)
  Res.Df RSS Df Sq F Pr(> F)的总和
1 19 167.60                      
2 19 508.48 0 -340.88

我的问题是,为什么方差分析无法显示F统计量和p.val。如果这是一个幼稚的问题,我表示歉意。

基于不同的斜率,这两种模型的降解速率不同,但我想知道这种差异在统计上的重要性。我希望这是有道理的。


2
您可能会注意到,ANOVA表将与分析相关的自由度列为0;您在两个模型中具有相同数量的变量,这就是无法计算F或p值的原因。
gung-恢复莫妮卡

5
在检查它们的拟合优度之前,我不会比较这些模型。我想您会在第二篇文章中发现响应和对数都不是时间的线性函数。这使斜率估算值的任何比较都(严重)受到质疑。
whuber

Answers:


11

如果您在一个长列中将数据设置为A和B作为新列,则可以将GLM运行具有连续时间变量和名义上的“实验”变量(A,B)的回归模型。方差分析的输出将为您提供参数之间差异的重要性。“截距”是常见的截距,“实验”因子将反映实验之间的截距之间的差异(实际上是整体均值),“时间”因子将是常见的斜率,而交互作用是实验之间的差异到斜坡。

我必须承认我作弊(?)并分别运行模型以获取两组参数及其错误,然后运行组合模型以获取处理之间的差异(在您的情况下为A和B)...


3
这是一个聪明的方法。当您“作弊”时,是否检查每个模型的误差方差是否大致相同?如果它们看起来有很大不同,那将如何影响您的建议?
whuber

GLM是一种很好的方法,对于探索数据,拟合单独的模型是判断实验之间误差差异的一种好方法。如果真的很在意,他们可以扩展GLM模型,使其包括特定于组的误差方差,而不是对所有实验数据都隐含的共同误差方差的隐含假设。
prince_of_pears

想到的另一件事是,OP是否对交易之间的降解率是否仅仅是彼此不同(忽略绝对速率)或是否在统计上(或实际上)上也不同于零而感兴趣。第一个等于检验假说,即治疗和时间之间的相互作用系数等于零。第二种方法是执行两个单独的检验(或一个联合假设检验),每个检验率都不为零。我可能对第一个之前的第二个测试更感兴趣。
prince_of_pears

5

由于两个模型具有相同的剩余自由度(即19),因此ANOVA分析不会显示F统计量和p。值,如果采用差异,则其为零!进行差异测试后,至少应有一个自由度才能执行F检验。


我不确定是否理解您的答案。剩余自由度是否相等是有原因的吗?关于替代方法比较斜率有什么建议吗?
罗兹

就在这里。在两个模型中,您都有21个观测值,即。在具有一个解释性随机变量的线性回归中(即Exp1(处理B)),回归变量的自由度为1。总自由度为。请注意,。因此,在两个模型中,因此您不能在此处使用F检验。Ť ř Ë ê Ñ ø ř Ë X p 1 d ˚F Ť = ñ - 1 = 20 d ˚F Ť = d ˚F ë [R [R ø - [R + d ˚F ř Ë ř Ë 小号小号ö ř 小号 d ˚F ë [R [R ö řn=21(TreatmentA)orExp1dfT=n1=20dfT=dferror+dfregressorsdferror=19
统计

除了F检验外,还有许多方法可以进行比较。最简单的方法是像在摘要中一样使用多个R平方和调整R平方,R平方或调整R平方越高的模型越好。在这里,更好的模型似乎是带有Exp1 $(Treatment A)的模型。但是请记住,您应该检查模型的残差以检查拟合模型的充分性。我个人不建议仅依赖R平方标准,并且您还应该检查线性模型中的其他假设。尤其要查看残差是否自相关。
统计
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.