我根据SAT分数和家庭/种族背景对大学的录取率进行了线性回归。数据是虚构的。这是对先前已回答问题的跟进。这个问题的重点是在为简单起见而撇开SAT分数时收集和解释优势比的方法。
变量是Accepted
(0或1)和Background
(“红色”或“蓝色”)。我设置了数据,以便具有“红色”背景的人们更容易进入:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
问题:
0.7是接受“蓝色”背景的人的比例吗?我之所以这样问是因为,
Backgroundblue
如果我改为运行以下代码,也会获得0.7的“ ”:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
我确实阅读了您超链接上的文章。
—
安东尼帕雷拉达,2015年
系数取幂:exp(coef(fit))。
—
安东尼帕雷拉达,2015年
是的:正如我在该线程回答中所解释的,截距的求幂使您具有参考案例的几率。
—
ub
R
明确要求的系数(通过函数coef
),你在呼唤你的输出中的“优势比”。这表明您可能想回顾一下两者之间的区别。