如何模拟满足特定约束(例如具有特定均值和标准偏差)的数据?
这个问题是由我的荟萃分析问题引起的。但是我想这对于在您要创建与现有已发布数据集完全相同的数据集的教学环境中也很有用。 我知道如何从给定的分布中生成随机数据。因此,例如,如果我读到了一项研究的结果,该研究具有: 平均102 标准偏差5.2 样本大小为72。 我可以rnorm在R中使用生成类似的数据。例如, set.seed(1234) x <- rnorm(n=72, mean=102, sd=5.2) 当然,平均值和标准差将分别不完全等于102和5.2: round(c(n=length(x), mean=mean(x), sd=sd(x)), 2) ## n mean sd ## 72.00 100.58 5.25 通常,我对如何模拟满足一组约束的数据感兴趣。在上述情况下,约束条件是样本大小,均值和标准差。在其他情况下,可能会有其他限制。例如, 可能知道数据或基础变量的最小值和最大值。 可能已知该变量仅采用整数值或仅采用非负值。 数据可能包含具有相互关系的多个变量。 问题 通常,我该如何模拟完全满足一组约束的数据? 是否有关于此的文章?R中是否有任何程序可以做到这一点? 为了举例说明,我应该并且应该如何模拟变量,使其具有特定的均值和sd?