Answers:
令LL =对数似然
这是您从summary(glm.fit)输出中看到的内容的快速摘要,
df = df_Sat-df_Null上的零偏差= 2(LL(饱和模型)-LL(零模型))
残余偏差= 2(LL(饱和模型)-LL(提议模型))df = df_Sat-df_提议
该饱和模型是,假定每个数据点的模型有其自身的参数(你有n个参数来估算该装置。)
的空模型假定确切的“相反的”,因为是承担所有的数据点中的一个参数,这意味着你只能估计1个参数。
该提出的模型假定您可以用p参数+截距项解释你的数据点,让你有P + 1点的参数。
如果您的Null偏差确实很小,则意味着Null模型可以很好地解释数据。同样,您的残差也是如此。
真正的小意思是什么?如果您的模型“良好”,则您的偏差约为(^ f_sat-df_model)自由度的Chi ^ 2。
如果您想将Null模型与Proposed模型进行比较,则可以查看
(零偏差-残余偏差)提议的df约为Chi ^ 2 -df Null =(n-(p + 1))-(n-1)= p
您是直接从R获得的结果吗?它们似乎有些奇怪,因为通常您应该看到在Null上报告的自由度始终高于在Residual上报告的自由度。这又是因为零偏差df =饱和df-零df = n-1残余偏差df =饱和df-建议的df = n-(p + 1)
零偏差显示了模型在没有截距的情况下对响应的预测程度。
剩余偏差显示了当包含预测变量时模型对响应的预测程度。从您的示例中可以看出,当添加22个预测变量时,偏差增加了3443.3(注意:自由度=观察数–预测数)。偏差的增加表明严重缺乏体能。
我们还可以使用残差来检验零假设是否成立(即Logistic回归模型为数据提供了足够的拟合度)。这是可能的,因为偏差是在一定的自由度下由卡方值给出的。为了检验重要性,我们可以使用R中的以下公式找出关联的p值:
p-value = 1 - pchisq(deviance, degrees of freedom)
使用上述残差和DF的值,您将获得大约为零的p值,这表明非常缺乏证据支持原假设。
> 1 - pchisq(4589.4, 1099)
[1] 0
GLM
吗?