我有数据集包含365观察三个变量即pm
,temp
和rain
。现在,我想检查是否pm
响应其他两个变量的变化。我的变量是:
pm10
=响应(取决于)temp
=预测变量(独立)rain
=预测变量(独立)
以下是我的数据的相关矩阵:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
问题是,当我研究回归模型的构建时,有人写道,可加方法应从与响应变量最相关的变量开始。在我的数据集中,rain
它与pm
(与相比temp
)高度相关,但是同时它也是一个虚拟变量(rain = 1,norain = 0),所以现在我有了从哪里开始的线索。我为问题附加了两个图像:第一个是数据的散点图,第二个图像是pm10
vs. 的散点图rain
,我也无法解释pm10
vs.的散点图rain
。有人可以帮我怎么开始吗?