Answers:
要生成具有指定相关结构的多元正态数据,您需要构造方差协方差矩阵并使用该chol
函数计算其Cholesky分解。所需vcov矩阵的Cholesky分解与观测值的独立随机法线向量的乘积将产生带有该方差协方差矩阵的随机法线数据。
v <- matrix(c(2,.3,.3,2), 2)
cv <- chol(v)
o <- replicate(1000, {
y <- cv %*% matrix(rnorm(100),2)
v1 <- var(y[1,])
v2 <- var(y[2,])
v3 <- cov(y[1,], y[2,])
return(c(v1,v2,v3))
})
## MCMC means should estimate components of v
rowMeans(o)
使用rmvnorm()函数,它包含3个参数:方差协方差矩阵,均值和行数。
sigma将具有3 * 5 = 15行和列。每个变量的每个观察值一个。设置这些15 ^ 2参数的方法有很多(弧形,双侧对称,非结构化...)。但是,您在填写此矩阵时要注意这些假设,尤其是当您将相关性/协方差设置为零时,或者将两个方差设置为相等时。首先,一个sigma矩阵可能看起来像这样:
sigma=matrix(c(
#y1 y2 y3
3 ,.5, 0, 0, 0, 0, 0, 0, 0, 0,.5,.2, 0, 0, 0,
.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2, 0, 0,
0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2, 0,
0 , 0,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,.2,.5,.2,
0 , 0, 0,.5, 3, 0, 0, 0, 0, 0, 0, 0, 0,.2,.5,
0 ,0 ,0 ,0 , 0, 3,.5, 0, 0, 0, 0, 0, 0, 0, 0,
0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0, 0,
0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0, 0,
0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0, 0, 0, 0,
0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3, 0, 0, 0, 0, 0,
.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 , 0, 3,.5, 0, 0, 0,
.2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0, 0,
0 ,.2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5, 0,
0 ,0 ,.2,.5,.2,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3,.5,
0 ,0 ,0 ,.2,.5,0 ,0 ,0 ,0 ,0 ,0 ,0 ,0 ,.5, 3
),15,15)
因此sigma [1,12]为.2,这意味着Y1的第一个观测值与Y3的第二个观测值之间的协方差为.2,并且以所有其他13个变量为条件。对角行不一定都必须是相同的数字:这是我所做的简化假设。有时候这很有意义,有时候却没有。通常,这意味着第三观察值与第四观察值之间的相关性与第一观察值与第二观察值之间的相关性相同。
您还需要手段。可能很简单
meanTreat=c(1:5,51:55,101:105)
meanControl=c(1,1,1,1,1,50,50,50,50,50,100,100,100,100,100)
在这里,前5个是Y1,...的5个观测值的均值,后5个是Y3的观测值
然后使用以下方法对您的数据进行2000次观察:
sampleT=rmvnorm(1000,meanTreat,sigma)
sampleC=rmvnorm(1000,meanControl,sigma)
sample=data.frame(cbind(sampleT,sampleC) )
sample$group=c(rep("Treat",1000),rep("Control",1000) )
colnames(sample)=c("Y11","Y12","Y13","Y14","Y15",
"Y21","Y22","Y23","Y24","Y25",
"Y31","Y32","Y33","Y34","Y35")
其中Y11是Y1的第一个观测值,...,Y15是Y1的第5个观测值。
n <- 3*5; sigma <- diag(1, nrow=n, ncol=n); sigma[rbind(cbind(1:n-1,1:n),cbind(1:n,1:n-1))] <- 1/2
。类似的方法将生成第二个示例。但是,它们有一个共同的问题:您在每个期间都丢失了之间的协方差这些矩阵不能反映出重复的度量结构。