实现岭回归:选择用于智能电网
我正在Python / C模块中实现Ridge回归,并且遇到了这个“小”问题。我的想法是,我想或多或少地等距采样有效自由度(例如“统计学习的要素”上第65页的图),即样本: df(λ)=∑i=1pd2id2i+λ,df(λ)=∑i=1pdi2di2+λ,\mathrm{df}(\lambda)=\sum_{i=1}^{p}\frac{d_i^2}{d_i^2+\lambda},d2idi2d_i^2XTXXTXX^TXdf(λmax)≈0df(λmax)≈0\mathrm{df}(\lambda_{\max})\approx 0df(λmin)=pdf(λmin)=p\mathrm{df}(\lambda_{\min})=pλmax=∑pid2i/cλmax=∑ipdi2/c\lambda_{\max}=\sum_i^p d_i^2/cλmax≫d2iλmax≫di2\lambda_{\max} \gg d_i^2cccc=0.1c=0.1c=0.1λmin=0λmin=0\lambda_{\min}=0 如标题所示,那么,我需要以一定比例从到采样,以便(大概)对进行采样,例如从到间隔为 ...有没有简单的方法可以做到这一点?我曾想过使用牛顿-拉夫森方法为每个解方程,但这会增加过多的迭代,特别是当大时。有什么建议么?λλ\lambdaλminλmin\lambda_{\min}λmaxλmax\lambda_{\max}df(λ)df(λ)\mathrm{df}(\lambda)0.10.10.1cccpppdf(λ)df(λ)\mathrm{df}(\lambda)λλ\lambdappp