Answers:
除了假设响应变量几乎是连续的之外,分位数回归不做分布假设,即关于残差的假设。如果你正在处理估计分位数作为函数预测X,远远地占据了重要的事情可能出错的问题是线性预测误设通过欠拟合,即未能包括非线性效应(一个常见问题)或相互作用效应。至少有两种推荐的方法。首先,如果您的样本量很大,则只适合一个更灵活的模型。一个很好的折衷方法是使用回归样条(例如受限三次样条(自然样条))使所有主效应都是非线性的。这样,除了交互之外,无需检查其他任何内容。第二种方法是希望模型简单(为什么?)但允许它复杂,然后评估对简单模型的复杂添加的影响。例如,我们可以评估非线性项或交互项或两者的组合贡献。下面是一个示例,使用R rms
和quantreg
包。使用折衷交互形式来限制参数的数量。相互作用被限制为不是双重非线性的。
require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f) # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)