我的情况是:
我已经对数转换了1个连续因变量和1个连续预测变量,以对它们的残差进行归一化,以进行简单的线性回归。
对于将这些转换后的变量与其原始上下文相关联的任何帮助,我将不胜感激。
我想使用线性回归来基于2010年缺勤的天数来预测2011年缺勤的天数。大多数学生缺勤0天或仅几天,数据正向左偏斜。因此,需要进行变换以使用线性回归。
我对两个变量都使用了log10(var + 1)(对于缺勤0天的学生使用+1)。我使用回归是因为我也想添加分类因素-性别/种族等。
我的问题是:
我想反馈给的听众不会理解log10(y)= log(constant)+ log(var2)x(坦率地说,我也不是)。
我的问题是:
a)是否有更好的方法来解释回归中的转换变量?即在2010年永远错失1天,而在2011年错失2天,而在2010年永远错失1个日志单位,2011年是否错失x个日志单位?
b)具体而言,鉴于此消息来源的引用语段如下:
“这是数学标准化考试成绩每增加一个单位的负二项式回归估计,因为模型中的其他变量保持不变。如果学生将她的数学考试成绩提高一个点,则对数的对数差在使模型中的其他变量保持不变的同时,预期计数将减少0.0016单位。”
我想知道:
- 这句话是不是说
UNTRANSFORMED
变量数学分数的每增加一单位,常数(a)UNTRANSFORMED
就会减少0.0016 ,那么如果数学分数上升两点,我就要从常数a减去0.0016 * 2? - 这是否意味着我通过使用指数(a)和指数(a + beta * 2)来获得几何平均值,并且我需要计算这两者之间的百分比差,以说明预测变量的影响/有因变量?
- 还是我完全错了?
我正在使用SPSS v20。很抱歉在一个很长的问题中提出这个问题。