Questions tagged «cooks-distance»


2
广义线性混合模型:诊断
我有一个随机截距逻辑回归(由于重复测量),我想做一些诊断,特别是关于异常值和有影响力的观察结果的诊断。 我查看了残差以查看是否有突出的观察结果。但我也想看看类似库克的距离或DFFITS。Hosmer和Lemeshow(2000)说,由于缺乏用于关联数据的模型诊断工具,因此应该只适合常规logistic回归模型而忽略相关性,而应使用可用于常规logistic回归的诊断工具。他们认为这比完全不进行诊断要好。 这本书是2000年出版的,我想知道现在是否有可用的方法用于模型诊断和混合效应逻辑回归?什么是检查异常值的好方法? 编辑(2013年11月5日): 由于缺乏响应,我想知道使用混合模型进行的诊断是否一般而言没有进行,或者在对数据建模时不是很重要的一步。因此,让我重新表述我的问题:一旦找到“良好”的回归模型,您会怎么做?

1
GLM使用哪种残差和库克距离?
有人知道库克距离的公式是什么吗?最初的库克距离公式使用学生化残差,但是为什么R使用std。计算GLM的库克距离图时的皮尔逊残差。我知道没有为GLM定义学生化残差,但是用于计算Cook距离的公式如何? 假设以下示例: numberofdrugs <- rcauchy(84, 10) healthvalue <- rpois(84,75) test <- glm(healthvalue ~ numberofdrugs, family=poisson) plot(test, which=5) 库克距离的公式是什么?换句话说,计算红色虚线的公式是什么?标准化皮尔逊残差的公式从何而来?


1
库克距离极限值
我一直在阅读库克的距离,以找出对我的回归影响较大的离群值。在库克的原始研究中,他说,将临界值设为1应该可以确定影响者。但是,其他各种研究也使用或作为截止值。4n4n\frac{4}{n}4n−k−14n−k−1\frac{4}{n-k-1} 在我的研究中,我的残差都不是D大于1。但是,如果我使用作为截止,那么会有各种数据被认为是影响者的点。我决定测试删除这些数据点是否会对我的一般线性回归有所不同。我所有的静脉注射都保留了其重要性,并且没有明显的变化。4n4n\frac{4}{n}(4149=.026)(4149=.026)(\frac{4}{149}= .026) 我应该保留所有数据点并使用1的截止率吗?或删除它们?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.