Questions tagged «logarithm»

数字的对数是必须增加底数才能获得数字的幂。

4
如何在线性回归中解释对数变换的系数?
我的情况是: 我已经对数转换了1个连续因变量和1个连续预测变量,以对它们的残差进行归一化,以进行简单的线性回归。 对于将这些转换后的变量与其原始上下文相关联的任何帮助,我将不胜感激。 我想使用线性回归来基于2010年缺勤的天数来预测2011年缺勤的天数。大多数学生缺勤0天或仅几天,数据正向左偏斜。因此,需要进行变换以使用线性回归。 我对两个变量都使用了log10(var + 1)(对于缺勤0天的学生使用+1)。我使用回归是因为我也想添加分类因素-性别/种族等。 我的问题是: 我想反馈给的听众不会理解log10(y)= log(constant)+ log(var2)x(坦率地说,我也不是)。 我的问题是: a)是否有更好的方法来解释回归中的转换变量?即在2010年永远错失1天,而在2011年错失2天,而在2010年永远错失1个日志单位,2011年是否错失x个日志单位? b)具体而言,鉴于此消息来源的引用语段如下: “这是数学标准化考试成绩每增加一个单位的负二项式回归估计,因为模型中的其他变量保持不变。如果学生将她的数学考试成绩提高一个点,则对数的对数差在使模型中的其他变量保持不变的同时,预期计数将减少0.0016单位。” 我想知道: 这句话是不是说UNTRANSFORMED变量数学分数的每增加一单位,常数(a)UNTRANSFORMED就会减少0.0016 ,那么如果数学分数上升两点,我就要从常数a减去0.0016 * 2? 这是否意味着我通过使用指数(a)和指数(a + beta * 2)来获得几何平均值,并且我需要计算这两者之间的百分比差,以说明预测变量的影响/有因变量? 还是我完全错了? 我正在使用SPSS v20。很抱歉在一个很长的问题中提出这个问题。

1
有关使用Quantreg识别曲线形状的建议
我正在使用quantreg程序包使用数据集中我值的第99个百分位数来建立回归模型。根据我之前提出的stackoverflow 问题的建议,我使用了以下代码结构。 mod <- rq(y ~ log(x), data=df, tau=.99) pDF <- data.frame(x = seq(1,10000, length=1000) ) pDF <- within(pDF, y <- predict(mod, newdata = pDF) ) 我将其显示在数据之上。我已经使用ggplot2绘制了此图像,并使用了点的alpha值。我认为在我的分析中并未充分考虑我分布的尾巴。也许这是由于以下事实:百分位类型测量忽略了一些单独的点。 其中一项评论建议 包小插图包括有关非线性分位数回归的部分,以及带有平滑样条线的模型等。 根据我之前的问题,我假设对数关系,但是我不确定这是否正确。我以为我可以在第99个百分位间隔处提取所有点,然后分别检查它们,但是我不确定该怎么做,或者这是否是一个好方法。我将不胜感激有关如何改善识别这种关系的任何建议。



3
在变量对数转换之前或之后进行相关
关于是否应在进行对数转换之前或之后为两个随机变量X和Y计算出皮尔逊相关性,是否有一个普遍的原则?有测试哪个程序更合适?它们产生相似但不同的值,因为对数变换是非线性的。是否取决于对数后X或Y是否更接近常态?如果是这样,那为什么重要呢?这是否意味着应该对X和Y与log(X)和log(Y)进行正态性检验,并据此确定pearson(x,y)是否比pearson(log(x),log( y))?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.