转换变量时,是否必须使用所有相同的转换?例如,是否可以选择不同的转换变量,例如:
令为年龄,就业时间,居住时间和收入。
Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)
或者,您是否必须与转换保持一致并使用所有相同的转换?如:
Y = B1*log(x1) + B2*log(x2) + B3*log(x3)
我的理解是,转型的目标是解决正常性问题。查看每个变量的直方图,我们可以看到它们呈现出非常不同的分布,这使我相信所需的转换在每个变量的基础上是不同的。
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav",
use.value.labels=T, to.data.frame=T)
hist(df[1:7])
## R Code
plot(df[1:7])