我将要学习R,而我的学习项目将需要对数据集应用混合或随机效应回归,以开发预测方程。我在这篇文章中分享了作者的关注点。 如何为混合效果模型选择nlme或lme4 R库?想知道NLME还是LME4是使自己熟悉的更好的软件包。一个更基本的问题是:线性和非线性混合效应建模之间有什么区别?
作为背景知识,我在我的MS研究中应用了ME建模(在MATLAB中,不是在R中),因此我熟悉固定变量和随机变量的处理方式。但是我不确定我所做的工作是线性的还是非线性的。它仅仅是所用方程式的函数形式还是其他形式?
我将要学习R,而我的学习项目将需要对数据集应用混合或随机效应回归,以开发预测方程。我在这篇文章中分享了作者的关注点。 如何为混合效果模型选择nlme或lme4 R库?想知道NLME还是LME4是使自己熟悉的更好的软件包。一个更基本的问题是:线性和非线性混合效应建模之间有什么区别?
作为背景知识,我在我的MS研究中应用了ME建模(在MATLAB中,不是在R中),因此我熟悉固定变量和随机变量的处理方式。但是我不确定我所做的工作是线性的还是非线性的。它仅仅是所用方程式的函数形式还是其他形式?
Answers:
线性回归模型和非线性回归模型之间有许多区别,但是最主要的数学模型是线性模型的参数是线性的,而非线性模型的参数则是非线性的。nlme
R包的作者Pinheiro和Bates(2000,第284-285页)优雅地描述了模型选择中的更多实质性考虑:
当选择回归模型来描述响应变量如何随协变量变化时,总是可以选择使用参数为线性的模型(例如多项式模型)。通过增加多项式模型的阶数,可以在观察到的数据范围内,对真实的(通常是非线性的)回归函数获得越来越精确的近似值。这些经验模型仅基于观察到的响应和协变量之间的关系,并且不包括有关产生数据的潜在机制的任何理论考虑。另一方面,非线性模型通常是机械的,即基于用于产生响应的机制的模型。结果,非线性模型中的模型参数通常具有自然的物理解释。即使是凭经验得出的,非线性模型通常也包含已知的理论数据特征,例如渐近线和单调性,在这种情况下,可以将其视为半力学模型。与竞争对手的线性模型(例如多项式)相比,非线性模型通常使用较少的参数,从而更简化了数据描述。与多项式模型相比,非线性模型还为观察到的数据范围之外的响应变量提供了更可靠的预测。给出更简洁的数据描述。与多项式模型相比,非线性模型还为观察到的数据范围之外的响应变量提供了更可靠的预测。给出更简洁的数据描述。与多项式模型相比,非线性模型还为观察到的数据范围之外的响应变量提供了更可靠的预测。
nlme和lme4软件包之间还存在一些很大的区别,这超出了线性问题。例如,使用nlme,您可以拟合线性或非线性模型,并针对任一类型指定组内误差的方差和相关结构(例如,自回归);lme4无法做到这一点。此外,随机效应可以在两个程序包中固定或交叉,但在lme4中指定交叉交叉随机效应并对其建模更容易(并且在计算上更加有效)。
我建议首先考虑a)是否需要非线性模型,b)是否需要指定组内方差或相关结构。如果这些答案中有任何一个是肯定的,那么您必须使用nlme(假设您坚持使用R)。如果您对具有交叉随机效应或嵌套和交叉随机效应的复杂组合的线性模型进行大量工作,则lme4可能是一个更好的选择。您可能需要学习使用这两个软件包。我首先学习了lme4,然后意识到我必须使用nlme,因为我几乎总是使用自回归错误结构。但是,当我分析带有交叉因子的实验数据时,我仍然更喜欢lme4。好消息是,我对lme4的了解很多都很好地转移到了nlme。无论哪种方式,
参考文献
Pinheiro,JC和Bates,DM(2000)。S和S-PLUS中的混合效果模型。纽约:施普林格出版社。
对于线性非线性部分,请参阅:关于该主题的CrossValidated文章,尤其是Charlie的第二个回答。在处理混合效果时,我认为没有任何变化。