2
如何选择最佳变换以实现线性?
我想进行多元线性回归,然后以很少的推算来预测新值。我的响应变量的范围是-2到+7,并且有三个预测变量(范围是+10-+200)。分布几乎是正常的。但是响应和预测变量之间的关系不是线性的,我在图中看到了曲线。例如这样的例子:http : //cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg 我想应用变换来实现线性。我尝试通过检查不同的函数并查看生成的图来变换响应变量,以查看响应和预测变量之间的线性关系。而且我发现有很多函数可以给我可见的线性关系。例如功能 t1=log(y+2.5)t1=log(y+2.5)t_1=\log(y+2.5) t2=1log(y+5)t2=1log(y+5)t_2=\frac{1}{\log(y+5)} t3=1y+5t3=1y+5t_3=\frac{1}{y+5} t4=1(y+10)3t4=1(y+10)3t_4=\frac{1}{(y+10)^3} t5=1(y+3)13t5=1(y+3)13t_5=\frac{1}{(y+3)^\frac{1}{3}}等给出类似的结果:http : //cs10418.userapi.com/u17020874/153949434/x_06f13dbf.jpg 在我将预测值进行反变换之后(对于为等)。分布或多或少与正态分布相似。t=1(y+10)3t=1(y+10)3t=\frac{1}{(y+10)^3}y′=1t13−10y′=1t13−10y’=\frac{1}{t^\frac{1}{3}}-10 如何为数据选择最佳转换?是否存在定量(且不是很复杂)的线性度评估方法?证明所选的转换是最好的,或者在可能的情况下自动找到它。 还是唯一的方法是进行非线性多元回归?