Questions tagged «diagnostic»

诊断措施(例如残差或根据残差计算出的一些摘要统计数据)用于评估模型拟合数据质量的某些方面。


3
解释glm模型的残留诊断图?
我正在寻找有关如何解释glm模型的残差图的指南。尤其是泊松,负二项式,二项式模型。当模型“正确”时,我们可以从这些图中得到什么?(例如,在处理泊松模型时,我们预计方差会随着预测值的增加而增加) 我知道答案取决于模型。任何参考(或​​要考虑的一般要点)将有所帮助/赞赏。

5
为什么我的引导时间间隔覆盖范围很差?
我想做一个课堂演示,在其中我将t间隔与引导间隔进行比较,并计算两者的覆盖率。我希望数据来自偏斜的分布,因此我选择将数据生成为exp(rnorm(10, 0, 2)) + 1对数正态偏移后的大小为10的样本。我编写了一个脚本来绘制1000个样本,并针对每个样本,基于1000个重复计算出95%的t间隔和95%的bootstrap百分位间隔。 当我运行脚本时,这两种方法的间隔都非常相似,并且覆盖率均为50-60%。我感到很惊讶,因为我认为引导间隔会更好。 我的问题是 在代码中犯了错误? 在计算间隔时出错了? 期望引导间隔具有更好的覆盖范围特性而犯了一个错误? 另外,在这种情况下是否有办法构建更可靠的配置项? tCI.total <- 0 bootCI.total <- 0 m <- 10 # sample size true.mean <- exp(2) + 1 for (i in 1:1000){ samp <- exp(rnorm(m,0,2)) + 1 tCI <- mean(samp) + c(1,-1)*qt(0.025,df=9)*sd(samp)/sqrt(10) boot.means <- rep(0,1000) for (j in 1:1000) boot.means[j] …


2
R中的似然比检验
假设我要对几个自变量进行单变量逻辑回归,如下所示: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) 我进行了模型比较(似然比检验),以查看该命令是否比空模型更好 1-pchisq(mod.a$null.deviance-mod.a$deviance, mod.a$df.null-mod.a$df.residual) 然后我建立了一个包含所有变量的模型 mod.c <- glm(x ~ a+b, data=z, family=binomial("logistic")) 为了查看变量在多变量模型中是否具有统计意义,我使用了以下lrtest命令epicalc lrtest(mod.c,mod.a) ### see if variable b is statistically significant after adjustment of a lrtest(mod.c,mod.b) ### see if variable a is statistically significant after …
25 r  logistic  diagnostic 

2
MCMC Geweke诊断
我正在运行Metropolis采样器(C ++),并希望使用以前的示例来估计收敛速度。 我发现一种易于实施的诊断程序是Geweke诊断程序,它可以计算两个样本平均值之间的差除以其估计的标准误差。由零处的光谱密度估计标准误差。 Zn=θ¯A−θ¯B1nASAθ^(0)+1nBSBθ^(0)−−−−−−−−−−−−−−−−√,Zn=θ¯A−θ¯B1nASθA^(0)+1nBSθB^(0),Z_n=\frac{\bar{\theta}_A-\bar{\theta}_B}{\sqrt{\frac{1}{n_A}\hat{S_{\theta}^A}(0)+\frac{1}{n_B}\hat{S_{\theta}^B}(0)}}, 其中,B是马尔可夫链中的两个窗口。我做了什么有一些研究^ 小号一个θ(0 )和^ 小号乙θ(0 ),但进入文学的能量谱密度和功率一塌糊涂谱密度,但我不会在这些议题的专家; 我只需要一个简单的答案:这些数量是否与样本方差相同?如果没有,计算它们的公式是什么?AAABBB小号一种θ^(0 )小号θ一种^(0)\hat{S_{\theta}^A}(0)SBθ^(0)SθB^(0)\hat{S_{\theta}^B}(0) 对Geweke诊断的另一个疑问是如何选择?上述文献所述,这是一些功能θ (X )和应该意味着频谱密度的存在^ 小号甲θ(0 ),但为了方便起见,我想的最简单的方法是使用恒等函数(使用样品本身)。它是否正确?θθ\thetaθ(X)θ(X)\theta(X)SAθ^(0)SθA^(0)\hat{S_{\theta}^A}(0) R coda程序包有描述,但也没有指定如何计算值。S小号S
14 mcmc  diagnostic 

3
在不采用信号检测理论衍生指标的情况下分析信号检测数据是否有效?
信号检测实验通常向观察者(或诊断系统)呈现信号或非信号,并且要求观察者报告他们是否认为所呈现的物品是信号还是非信号。此类实验产生的数据填充2x2矩阵: 信号检测理论表示这样的数据,即表示“信号/非信号”决策基于信号连续性的场景,在这种情况下,信号试验通常比非信号试验具有更高的价值,观察者只需选择一个标准值,高于该值他们将报告“信号”: 在上图中,绿色和红色分布分别代表“信号”分布和“非信号”分布,而灰线则代表给定观察者选择的标准。在灰线的右侧,绿色曲线下方的区域表示命中,红色曲线下方的区域表示误报警。在灰线的左侧,绿色曲线下方的区域表示未命中,红色曲线下方的区域表示正确的拒绝。 可以想象,根据此模型,落入上面2x2表的每个单元格中的响应比例由以下方式确定: 从绿色和红色分布中采样的试验的相对比例(基本比率) 观察者选择的标准 分布之间的分离 每个分布的方差 分布之间的方差相等有任何偏离(上面描述了方差相等) 每个分布的形状(以上均为高斯分布) 通常,只能通过让观察者在多个不同的标准级别上做出决策来评估#5和#6的影响,因此我们暂时将其忽略。另外,#3和#4仅相对于彼此有意义(例如,相对于分布的可变性而言,间隔有多大?),通过“可区分性”(也称为d')的度量来概括。因此,信号检测理论禁止根据信号检测数据评估两个属性:标准和可辨别性。 但是,我经常注意到,研究报告(尤其是医学领域的报告)未能应用信号检测框架,而是尝试分析诸如“正预测值”,“负预测值”,“灵敏度”和“特异性”之类的量。 ”,它们都代表与上面2x2表不同的边际值(有关详细信息,请参见此处)。 这些边际属性提供什么效用?我倾向于完全无视它们,因为它们混淆了标准和可辨别性的理论上独立的影响,但我可能只是缺乏想象力来考虑它们的好处。

1
证明马氏距离与杠杆之间的关系?
我在维基百科上看到过公式。与马氏距离和杠杆有关: 马氏距离与杠杆统计Hhh密切相关,但具有不同的标度:d2= (N− 1 )(h − 1ñ)。D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). 在链接的文章中,维基百科用以下术语描述了Hhh: 在该线性回归模型,用于杠杆得分一世Ť ^ hithi^{th}数据单位被定义为:H我我= (高)我我,hii=(H)ii,h_{ii}=(H)_{ii},在一世Ť ^ hithi^{th}帽子矩阵的对角元素H= X(X⊤X)− 1X⊤H=X(X⊤X)−1X⊤H=X(X^{\top}X)^{-1}X^{\top},其中⊤表示矩阵转置。⊤⊤^{\top} 我在任何地方都找不到证明。我试图从定义开始,但是没有任何进展。任何人都可以给出提示吗?

3
基于诊断指标( / AUC /精度/ RMSE等)的值,我的模型是否还好?
我已经安装好模型,并试图了解它是否有好处。我已经计算出推荐的指标进行评估( / AUC /准确性/预测误差等),但不知道如何解释它们。简而言之,如何根据指标判断我的模型是否良好?例如,为0.6是否足以让我继续进行推断或做出科学/商业决策?[R2R2R^2[R2R2R^2 这个问题是有意的,涵盖了会员经常遇到的各种情况;这样的问题可以作为此问题的副本来解决。欢迎进行修改以扩大范围,使其超出此处提到的指标,还有其他答案-尤其是那些提供有关其他类别指标的见解的答案。

1
如何解释TBATS模型结果和模型诊断
我有一个半小时的需求数据,这是一个多个季节的时间序列。我在R的package中使用tbats过forecast,并得到如下结果: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) 这是否意味着该序列不一定要使用Box-Cox变换,并且误差项是ARMA(5,4),而6、6和5项则用来解释季节性?阻尼参数0.8383表示什么,也用于转换吗? 以下是模型的分解图: 我想知道该怎么做level并slope讲述该模型。“坡度”告诉趋势,那又如何level呢?如何获得更清晰的情节session 1和session 2,它们分别是每天和每周的季节性。 tbats除了RMSE值,我还知道如何进行模型诊断以评估模型。正常方法是检查错误是否为白噪声,但此处的错误应该是ARMA系列的。我绘制了错误的'acf'和'pacf',但我认为它看起来不像ARMA(5,4)。这是否意味着我的模型不好? acf(resid(model1),lag.max = 1000) pacf(resid(model1),lag.max=1000) 最后一个问题RMSE是通过使用拟合值和真实值来计算的。如果我使用预测值fc1.week$mean和真实值来评估模型RMSE怎么办,它仍被称为?或者,还有这个名字吗? fc1.week <-forecast(model1,h=48*7) fc1.week.demand<-fc1.week$mean


4
是否对OLS中的遗漏变量偏差进行了测试?
我知道Ramsey重置测试可能会检测到非线性相关性。但是,如果只丢弃其中一个回归系数(仅是线性相关性),则可能会产生偏差,具体取决于相关性。重置测试显然未检测到这一点。 我没有找到针对这种情况的测试,而是这样声明:“除非包含潜在的省略变量,否则您无法测试OVB”。这可能是一个合理的陈述,不是吗?

2
lm的默认诊断图的可能扩展(在R中和一般而言)?
我开始深入研究plot.lm函数,该函数给出了lm的六个图,它们是: 残差与拟合值的关系图 sqrt(|残差|)对拟合值的比例位置图 普通QQ图,库克距离与行标签的图 残差与杠杆的关系图 库克距离与杠杆/(1-杠杆)的关系图 我想知道线性图还存在电流图的其他常见/有用扩展,以及它们如何在R中完成?(也欢迎链接到包装的文章) 因此,boxcox函数(来自{MASS})是另一个有用的诊断图的示例(这样的答案会很好),但是,我对R中lm的现有默认诊断图的变化/扩展感到好奇(尽管一般始终欢迎您对此主题发表其他评论)。 这是我的意思的一些简单示例: #Some example code for all of us to refer to set.seed(2542) x1 <- rnorm(100) x2 <- runif(100, -2,2) eps <- rnorm(100,0,2) y <- 1 + 2*x1 + 3*x2 + eps y[1:4] <- 14 # adding some contaminated points fit <- lm(y~x1+x2) …

4
残差对拟合值的对角直线作多元回归
我正在观察数据残差的奇怪模式: [编辑]这是两个变量的部分回归图: [EDIT2]添加了PP图 分布似乎运行良好(请参阅下文),但是我不知道这条直线可能来自何处。有任何想法吗? [UPDATE 31.07] 事实证明您是绝对正确的,我的案例中转发次数确实为0,而这〜15个案例导致了这些奇怪的残留模式。 现在,残差看起来好多了: 我还用黄土线包括了部分回归。

7
敏感性或特异性是患病率的函数吗?
标准教学说,敏感性和特异性是测试的属性,与患病率无关。但这不只是一个假设吗? 哈里森的内科学原理第19版说 长期以来,人们一直认为敏感性和特异性是测试准确性与患病率无关的参数,许多文献仍在发表这一声明。然而,这种统计学上有用的假设在临床上是简单的。...住院患者的测试敏感性可能更高,而门诊患者的测试特异性更高。 (住院患者的患病率通常高于门诊患者) 这些参数之间是否存在数学或近似图形关系? 即使这个链接也称其为“简化”。为什么? 编辑:我知道如何定义灵敏度。正如答案中所提到的,没有涉及流行的术语。我本人一直坚持认为,这些是测试的属性,不受所使用的总体影响,直到我遇到此声明,因此才提出问题。但我认为,造成这种混乱的原因不是由于定义,而是由于这些值的实际计算。特异性和敏感性是使用2x2表格计算的,这里参考人群的普遍性重要吗?这就是他们所指的吗?如果可以,功能是什么?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.