您的问题是具有定量和定性预测变量的回归模型的完美示例。具体来说,三个年龄组 是定性变量,定量变量是购物习惯和减肥(我猜是因为您正在计算相关性)。1 ,2 ,&3
我必须强调,这是一种比计算单独的逐组相关性更好的建模方法,因为您要建模的数据更多,因此误差估计(p值等)将更加可靠。一个更技术性的原因是,用于检验回归系数的显着性的t检验统计量具有更高的自由度。
根据定性预测变量可以由指标变量处理的规则进行操作,此处仅需要两个指标变量,它们的定义如下:Cc − 1X1个,X2
X1个= 1, 如果某人属于第1组; 否则为0 。
X2= 1, 如果某人属于第二组; 否则为0 。
这意味着第组由;用表示您的反应-购物习惯,用表示定量的可变体重减轻量。您现在适合此线性模型3X1个= 0 ,X2= 0ÿw ^
Ë[ Y] =β0+β1个X1个+β2X2+β3w ^。
一个明显的问题是,是否改变和(因为我随机选择购物习惯作为响应变量)。答案是肯定的。回归系数的估计值将发生变化,但是对以组为条件的组之间的“关联”进行的检验(此处为t检验,但与针对单个预测变量的相关性检验相同)不会更改。具体来说,
w ^ÿ
Ë[ Y] =β0+β3w ^ -对于第三组,
Ë[ Y] = (β0+β2)+β3w ^ -对于第二组,
Ë[ Y] = (β0+β1个)+β3w ^ -对于第一组,
,如果您绘制与则相当于有3条不同的线,具体取决于各组。这是一种可视化测试目的的好方法(基本上是EDA和模型检查的一种形式,但是您需要正确区分分组的观察结果)。三个平行线表示三组和之间没有相互作用,并且很多相互作用意味着这些线将彼此相交。
ÿw ^w ^
您要求的测试方法如何。基本上,一旦您拟合模型并获得估计,就需要测试一些对比。专为您进行比较:
第2组vs第3组: β2+β0-β0= 0 ,
第一组vs第3组: β1个+β0-β0= 0 ,
第2组vs第1组: β2+β0− (β0+β1个)= 0。