Questions tagged «r-squared»

确定系数通常用,是总响应方差的比例,由回归模型解释。也可以用于建议的各种伪R平方,例如用于逻辑回归(和其他模型)。 R2

1
为什么我的VAR模型在非平稳数据上比固定数据能更好地工作?
我正在使用python的statsmodels VAR库为财务时间序列数据建模,有些结果令我感到困惑。我知道VAR模型假设时间序列数据是固定的。我无意中拟合了两种不同证券的非平稳对数价格对数,并且令人惊讶的是,拟合值和样本内预测在相对微不足道的固定残差下非常准确。样本内预测的为99%,预测残差系列的标准偏差为预测值的10%左右。[R2[R2R^2 但是,当我改变对数价格并将该时间序列拟合到VAR模型时,拟合值和预测值相差甚远,在均值附近处于狭窄范围内。结果,残差在预测对数收益方面比拟合值做得更好,预测残差的标准偏差比拟合数据系列大15倍,而预测序列的.007值。[R2[R2R^2 我是否会误解VAR模型上的拟合残差与其他残差?为什么非平稳时间序列会比基于相同基础数据的平稳时间序列产生更准确的预测?我在同一个python库中使用ARMA模型进行了很好的工作,却看不到像对单个系列数据建模那样的东西。

1
可以使用线性回归中的标准化
我试图解释一篇文章的结果,他们运用多元回归来预测各种结果。但是的(定义为标准B系数,其中是从属变量且是预测变量)报告似乎与报告的不匹配:ββ\betaβx1=Bx1⋅SDx1SDyβx1=Bx1⋅SDx1SDy\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y}yyyx1x1x_1R2R2R^2 尽管为-0.83,-0.29,-0.16,-0.43、0.25和-0.29,但报告的仅为0.20。ββ\betaR2R2R^2 同样,三个预测因子:体重,BMI和脂肪%是共线的,在性别内彼此相关,r = 0.8-0.9。 值是否适合这些,或者与之间没有直接关系?R2R2R^2ββ\betaββ\betaR2R2R^2 此外,多共线性预测变量的问题可能会影响第四个预测变量的(VO2max),它与上述三个变量在r = 0.4附近相关吗?ββ\beta

1
R平方的有趣推导
多年前,我通过试验数据和转换发现了这种身份。在向我的统计教授解释了这一点之后,他进入下一堂课,使用了矢量和矩阵符号作为一页证明。不幸的是我丢了他给我的纸。(那是在2007年) 有人能够重建证明吗? 让 (X一世,ÿ一世)(X一世,ÿ一世)(x_i,y_i)是您的原始数据点。通过旋转角度定义一组新的数据点;称这些点。θθ\theta(X′一世,ÿ′一世)(X一世′,ÿ一世′)(x'_i,y'_i) 原始点集的R平方值等于导数相对于新点集每个坐标的标准偏差自然对数的的负乘积,每个点在求θθ\thetaθ = 0θ=0\theta=0 [R2= - (ddθln(σX′)∣∣θ = 0)(ddθln(σÿ′)∣∣θ = 0)[R2=-(ddθln⁡(σX′)|θ=0)(ddθln⁡(σÿ′)|θ=0)r^2= - \left(\left.\frac{d}{d\theta}\ln(\sigma_{x'})\right|_{\theta=0} \right) \left(\left.\frac{d}{d\theta}\ln(\sigma_{y'})\right|_{\theta=0} \right)

1
调整后的R平方是否试图估计固定分数或随机分数总体的R平方?
可以假设固定分数或随机分数来定义 r平方:ρ2ρ2\rho^2 固定分数:样本量和预测变量的特定值保持固定。因此,ρ2fρf2\rho^2_f是当预测变量值保持恒定时在总体回归方程中由结果解释的方差比例。 随机分数:预测变量的特定值是从分布中得出的。因此,指的是总体中结果中解释的方差比例,其中预测变量值对应于预测变量的总体分布。ρ2rρr2\rho^2_r 之前我曾问过这种区别是否对估计有很大的不同ρ2ρ2\rho^2。我也普遍询问过如何计算的无偏估计 ρ2ρ2\rho^2。 我看到随着样本数量的增加,固定得分和随机得分之间的区别变得不那么重要了。但是,我试图确认调整后的是用于估计固定分数还是随机分数。R2R2R^2ρ2ρ2\rho^2 问题 调整后的 旨在估计固定分数或随机分数?R2R2R^2ρ2ρ2\rho^2 是否存在关于调整后的r平方的公式与一种或其他形式之间的关系的原则性解释?ρ2ρ2\rho^2 我困惑的背景 当我读殷和范(2001,p.206)时,他们写道: 多元回归模型的基本假设之一是自变量的值是已知常数,并且在实验之前由研究人员确定。只有因变量可以随样本的不同而自由变化。该回归模型称为固定线性回归模型。 但是,在社会科学和行为科学中,研究人员很少固定自变量的值,而且自变量也容易出现随机误差。因此,已经提出了第二种应用回归模型,在该模型中,因变量和自变量都可以变化(Binder,1959; Park&Dudycha,1974)。该模型称为随机模型(或校正模型)。尽管在正态性假设下从随机模型和固定模型获得的回归系数的最大似然估计是相同的,但它们的分布却非常不同。随机模型是如此复杂,以至于需要接受更多的研究才能代替通常使用的固定线性回归模型。因此,通常采用固定模型,即使没有完全满足这些假设(Claudy,1978年)。假设违背固定回归模型的这种应用将导致“过度拟合”,因为从效果不佳的样本数据中引入的随机误差往往会在过程中被大写。结果,以这种方式获得的样本多重相关系数往往会高估真实的人口多重相关(Claudy,1978; Cohen&Cohen,1983; Cummings,1982)。 因此,我不清楚上面的说法是说调整后的补偿了随机模型引入的误差,还是只是在标记该随机模型存在的文件中作了警告,但该论文将专注于固定模型。R2R2R^2 参考文献 Yin,P.,&Fan,X.(2001年)。在多元回归中估计收缩:不同分析方法的比较。实验教育杂志,69(2),203-224。PDF格式R2R2R^2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.