我衷心希望我对这个问题的表述方式能够得到明确的回答-如果没有,请让我知道,我会再试一次!我还应该注意,我将使用R进行这些分析。
我plant performance (Ys)
怀疑有几种措施受到了我实施的四种治疗的影响- flower thinning (X1), fertilization (X2), leaf clipping (X3)
和biased flower thinning (X4)
。对于所有可能的Y,N至少为242,因此我的样本量很大。所有地块都进行了稀疏或不间断处理,但每个地块也经历了其他三种处理方式中的一种(也只有一种)(或没有,也有对照地块)。该设计的目的是测试其他三种处理是否能够“掩盖”或“增强”细化效果。因此,通过设计,后三种处理(X2-X4)不能相互作用彼此,因为他们没有交叉,但他们可以每疏花互动-他们可能会做。
我的明确假设是:1)开花稀疏将很重要,并且2)X1*X2, X1*X3, and X1*X4,
花卉稀疏与其他三种处理之间的相互作用项也将很重要。就是说,疏花应该很重要,但是其他三种处理方式却应该大大改变疏花的方式。
我想将所有这些信息包括在混合模型中:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
但是有一个困扰:我有充分的理由相信细化对Y的影响是非线性的。它们可能是二次方的,但在某些情况下甚至可能是三次方的。这是因为细化对性能的影响很可能在更高的细化水平下更快地增加。如果我尝试通过为X1添加二次项和三次项来通过上述等式对这种非线性关系进行建模,那么我不确定如何对交互项进行建模-我应该包括X1的所有可能组合(X1)^ 2,以及(X1)^ 3 * X2,X3和X4?因为即使有我拥有的数据点的数量,这似乎也要尝试估计很多参数,而且我不确定如何解释得到的结果。就是说,我没有生物学上的理由认为这将是对情况进行建模的不明智的方式。
因此,对于如何解决此问题,我有三点想法:
- 首先拟合一个较小的模型,例如
Y ~ X1 + X1^2 + X^3 + Random effects
,其唯一目的是弄清楚细化和Y之间的关系是线性,二次还是立方,然后通过平方根或立方根转换细化以适当地线性化关系。从那里,可以使用转换后的变量对交互项进行建模。- 假设重要的相互作用(如果发生)仅影响X1项之一(即,仅线性,二次或三次项),并相应地对相互作用进行建模。我什至不确定这种方法是否有意义。
- 只需将“完全模型”与细化项和上述其他处理之间的所有可能交互项拟合即可。然后,删除无关紧要的交互项,并使用图形和其他技术来解释结果。
考虑到我对假设检验而不是模型选择感兴趣,这些方法中的哪一种(如果有的话)最有意义,为什么?特别是,如果上面的#1 没有意义,那为什么呢?我已经阅读了这篇文章和这篇文章,并尝试去理解它们对我的意义,但是任何进一步阅读的资料也将不胜感激!