1
使用百分位数作为预测变量-好主意吗?
我正在考虑一个问题,该问题是使用线性回归来预测客户的对数(支出)。 我正在考虑将哪些功能用作输入,并想知道将变量的百分位数用作输入是否可以。 例如,我可以将公司收入用作输入。我想知道的是,我是否可以使用公司收入百分比来代替。 另一个示例是分类行业分类器(NAICS)-如果我要查看每个NAICS代码的中位数支出,然后将每个NAICS代码分配给一个“ NAICS百分位数”,那将是我可以使用的有效解释变量吗? 只想知道使用百分位数时是否有任何需要注意的问题?它在某种程度上等同于一种要素缩放吗?