这是我针对这个问题的上下文:据我所知,使用加权数据和数据survey
包时,我们无法在R中运行普通的最小二乘回归。在这里,我们必须使用svyglm()
,而不是运行一个广义线性模型(可能是同一件事?在这里我不清楚什么是不同的)。
在OLS中,通过该lm()
函数,它可以计算R平方值,我确实理解其解释。但是,svyglm()
似乎并没有计算出这个误差,而是给了我一个偏差,我在互联网上的短暂旅行告诉我,这是一种拟合优度度量,其解释与R平方不同。
所以我想我基本上有两个我希望得到指导的问题:
- 为什么
survey
似乎无法在Stata中使用加权数据来在包中运行OLS ? - 广义线性模型的偏差和r平方值在解释上有什么区别?
2
欢迎访问@RichardBlissett网站,+ 1是一个很好的问题。OLS回归是广义线性模型的一种特殊情况,其中链接函数是恒等函数且响应分布是正态的(有关更多信息,请参见此处的答案:logit和probit模型之间的区别)。有用于GLiM的“伪R2”,但它们有争议(有关更多信息,请参见此处:which-pseudo-r2-to-report-for-logistic-regression)。
—
gung-恢复莫妮卡
非常感谢您的评论(很抱歉,我花了这么长时间回复...我迷失了这个问题,完全忘记了我没有将其放在SO上)。谢谢,这是一对令人惊讶的解释。我猜想我的问题是:我认为,那么这些统计数据包将不会运行OLS,因为使用调查加权数据运行时存在一些基本问题。我似乎无法弄清楚那个问题是什么。
—
RickyB 2013年
偏差是方差的一般化,而预期偏差是R平方的一般化。问题是,对于预期的偏差似乎没有一个简单或普遍的答案,例如,请参见此处:stats.stackexchange.com/questions/124306/…–
—
nukimov