我有一个包含三个变量的数据集,其中所有变量都是定量的。让我们将其称为,和。我通过MCMC在贝叶斯角度拟合回归模型rjags
我进行了探索性分析,的散点图建议应使用二次项。然后我装了两个模型
(1)
(2)
在模型1中,每个参数的效果大小都不小,并且95%可信区间的值不为。
在模型2中,参数和的效果大小较小,并且所有参数的可信区间均包含。
可信区间包含的事实足以说明该参数不重要吗?
然后我调整了以下模型
(3)
每个参数的效果大小都不小,但是除外,所有可信区间都包含。 0
在贝叶斯统计中进行变量选择的正确方法是哪种?
编辑:我可以在任何回归模型(如Beta模型)中使用套索吗?我使用的是变量分散的模型,其中 其中是向量。我也应该在使用Laplace 吗?δ
EDIT2:我安装了两个模型,一个模型具有针对,高斯先验模型,另一种具有Laplace(double-exponential)模型。δ Ĵ
高斯模型的估计是
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
拉索模型的估计是
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
在套索模型中和的估计减少了很多,这意味着我应该从模型中删除此变量吗?δ 4
编辑3:与高斯先验模型相比,双指数先验(Lasso)模型给我更大的偏差,BIC和DIC值,在高斯模型中消除色散系数后,我什至得到的值也更小。