使用R,我为来自连续和离散预测变量混合的单个响应变量拟合了线性模型。这是非常基础的,但是我很难理解离散因子的系数是如何工作的。
概念:显然,连续变量'x'的系数是以以下形式应用的,y = coefx(varx) + intercept
但是如果该因子是非数值的,那么该因子对因子z怎么起作用?y = coefx(varx) + coefz(factorz???) + intercept
具体:我在R中拟合了一个模型,lm(log(c) ~ log(d) + h + a + f + h:a)
其中h
和f
是离散的非数值因素。系数为:
Coefficients:
Estimate
(Intercept) -0.679695
log(d) 1.791294
h1 0.870735
h2 -0.447570
h3 0.542033
a 0.037362
f1 -0.588362
f2 0.816825
f3 0.534440
h1:a -0.085658
h2:a -0.034970
h3:a -0.040637
我如何使用它们来创建预测方程:
log(c) = 1.791294(log(d)) + 0.037362(a) + h??? + f???? + h:a???? + -0.679695
还是我做错了?
我认为这概念是如果对象落在类别h1
和f2
,公式变为:
log(c) = 1.791294(log(d)) + 0.037362(a) + 0.870735 + 0.816825 + h:a???? + -0.679695
但是我真的不清楚h:a
交互式术语如何解析。谢谢你对我放松。
g1