Answers:
为了给出与@neverKnowsBest的响应一致的示例,请考虑在阶乘实验中有3个因子,每个因子被视为具有2个水平的分类变量,并且在每次复制中测试了因子水平的每种可能组合。如果实验仅进行一次(无重复),则此设计将需要次运行。运行可以通过以下8x3矩阵来描述: 其中,行表示运行,列表示级别因素: 2 3 = 8 [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0 1 1 0 1 0 1 1 1 1 1 ] [ A B C ]。
AB&AC&BC&ABC \\ \ end {array} \ right]。 尽管这两个矩阵相关,但设计矩阵描述了如何收集数据,而模型矩阵则用于分析实验结果。[ I A B C A B A C B C A B C ]。
引文
蒙哥马利(2009)。实验设计与分析,第7版。约翰·威利父子公司
在设计的实验中,我们经常大惊小怪的是,设计矩阵 包含执行实验的因素的水平以及模型矩阵(也写为但实际上是设计矩阵的函数)包含诸如全1的列(代表截距项)之类的东西,以及设计矩阵各列的乘积和幂(代表诸如交互作用和多项式模型项之类的事物)。我将在模型矩阵中称为。X X Ŷ = X β
实验设计着重于如何构造设计矩阵和模型矩阵,因为它们发生在收集数据之前。如果已经收集了数据,则将设计固定下来,但是您仍然可以更改模型矩阵。有时,设计好的实验会在设计矩阵中包含某些固定列,称为协变量,这些列无法控制,但您可以观察到。
根据您对模型和设计的选择,可能会发生某些事情……某些参数可能难以估算(估算器的方差较大),或者您可能根本无法估算某些参数。我会说,确定合适的模型具有一些艺术元素,而设计实验肯定是一门艺术。
之所以称为设计矩阵,是因为矩阵的列基于模型的设计。我不认为就可以从某种意义上任意创建,因为一旦确定了模型,设计矩阵就已经确定了(基本上上每个您要估计的都有一列)。但是,由于可以将模型构建视为一门艺术,因此我认为可以构建设计矩阵。X X β
只是您的数据(减去响应变量)。我相信它被称为设计矩阵,因为它定义了模型的“设计”(通过培训)。
X是否可以像艺术中那样任意设计或构造?
基本上,这个问题可以归结为“您是否可以建立在制造数据上训练的模型”,答案显然是肯定的。例如,这是一种构造任意设计矩阵(实际上是设计矢量)的方法,该模型将为模型提供预定义的斜率并进行截距:
design_mat=function(b, a){
X = runif(100)
Y = a*X + b
data.frame(X,Y)
}
df = design_mat(-5, 12.3)
(lm(Y~X, data=df))
Call:
lm(formula = Y ~ X, data = df)
Coefficients:
(Intercept) X
-5.0 12.3
在我的示例中,出于说明目的,我“构建”了来自随机设计数据的响应,但是您可以很容易地使用从随机响应中构建设计矩阵。