我对适合古科学中使用的特定类型模型的不同方法进行了基于计算机的评估。我的训练集很大,因此我随机(分层随机抽样)留出了测试集。我为训练集样本拟合了种不同的方法,并使用结果模型预测了测试集样本的响应,并针对测试集中的样本计算了RMSEP。这是一次运行。
然后,我多次重复此过程,每次我通过随机采样新的测试集来选择不同的训练集。
完成此操作后,我想研究种方法中的任何一种是否具有更好或更差的RMSEP性能。我还想对成对方法进行多次比较。
我的方法是拟合线性混合效果(LME)模型,并为Run提供单个随机效果。我使用lmer()
了lme4软件包中的数据,以适应multcomp软件包中的模型和函数,以执行多次比较。我的模特本质上是
lmer(RMSEP ~ method + (1 | Run), data = FOO)
其中method
是一个因素,指示用于生成测试集的模型预测的哪种方法,并且Run
是每个特定运行的指标 “实验”的。
我的问题是关于LME的残差。给定运行的单个随机效应我假设该的RMSEP值在某种程度上相关,但在运行之间不相关,这是基于随机效应所提供的诱导相关性。
运行之间的独立性这一假设有效吗?如果不是,那么在LME模型中是否可以解决这个问题,还是我应该寻求采用其他类型的静态分析来回答我的问题?