Questions tagged «deviance»

偏差是最大可实现对数可能性与拟合模型下获得的对数可能性之间差异的两倍。


3
什么是偏差?(特别是在CART / rpart中)
什么是“偏差”,它是如何计算的,在统计的不同字段中有什么用? 特别是,我个人对它在CART中的使用(及其在R中的rpart中的实现)感兴趣。 我之所以这么问,是因为维基文章似乎有所欠缺,您的见解将受到极大欢迎。
45 r  cart  rpart  deviance 

2
逻辑回归:伯努利与二项式响应变量
我想使用以下二项式响应并以和作为预测因子进行逻辑回归。 X1个X1个X_1X2X2X_2 我可以采用以下格式提供与伯努利回复相同的数据。 逻辑回归输出用于这2个数据集是大多相同的。偏差残差和AIC不同。(两种情况下零偏差和残余偏差之间的差异相同,为0.228。) 以下是R的回归输出。这些数据集称为binom.data和bern.data。 这是二项式输出。 Call: glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2, family = binomial, data = binom.data) Deviance Residuals: [1] 0 0 0 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.9649 21.6072 -0.137 0.891 X1Yes -0.1897 2.5290 -0.075 0.940 X2 0.3596 1.9094 0.188 …

1
交叉验证泊松模型的误差度量
我正在交叉验证试图预测计数的模型。如果这是二进制分类问题,那么我将计算出不匹配的AUC,如果这是回归问题,则将计算出不匹配的RMSE或MAE。 对于Poisson模型,我可以使用哪些误差度量来评估样本外预测的“准确性”?是否存在AUC的Poisson扩展,可以查看预测对实际值的排序程度? 似乎很多Kaggle竞赛都在使用根均方根平方误差或RMLSE来进行计数(例如,一次yelp审查将获得的有用票数或患者在医院花费的天数)。 /编辑:我一直在做的一件事是计算预测值的十分之一,然后查看实际计数,并按分位数进行分组。如果十分位数1低,十分位数10高且两者之间的十分位数都在增加,则我一直将该模型称为“好”,但是我一直难以量化此过程,并且我相信会有更好的方法方法。 /编辑2:我正在寻找一个公式,该公式采用预测值和实际值并返回一些“错误”或“准确性”指标。我的计划是在交叉验证过程中根据折叠数据计算此函数,然后将其用于比较各种模型(例如,泊松回归,随机森林和GBM)。 例如,一个这样的函数是RMSE = sqrt(mean((predicted-actual)^2))。另一个这样的功能是AUC。这两个函数似乎都不适合泊松数据。

1
从lmer模型计算效果的可重复性
我刚刚碰到了这篇论文,该论文描述了如何通过混合效应建模来计算测量的可重复性(又称可靠性,又称类内相关性)。R代码为: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
Logistic回归:如何获得饱和模型
我刚刚了解了逻辑回归的偏差度量。但是,对我来说,称为饱和模型的部分尚不清楚。 我在Google上进行了广泛的搜索,但没有结果回答我的问题。到目前为止,我发现一个饱和模型对每个观测值都有一个参数,因此可以实现完美拟合。这对我来说很清楚。但是:(饱和模型的)拟合值还等于观测值。 由于从我所知,被用于分类逻辑回归给定的观察到的数据与额外的标签协变量。但是,偏差度量采用的是概率,而不是实际的标号。一种方法是将计算出的逻辑回归的预测概率与观察到的概率进行比较。但是,由于只给出了标签而不是概率,我很困惑如何从这些标签构建饱和模型?ÿ∈ { 0 ,1 }ÿ∈{0,1个}y \in \{0,1\}

1
逻辑回归中的Pearson VS Deviance残差
我知道标准化的Pearson残差是以传统的概率方式获得的: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} 和偏差残差通过更统计的方式获得(每个点对可能性的贡献): di=si−2[yilogπi^+(1−yi)log(1−πi)]−−−−−−−−−−−−−−−−−−−−−−−−−−√di=si−2[yilog⁡πi^+(1−yi)log⁡(1−πi)] d_i = s_i \sqrt{-2[y_i \log \hat{\pi_i} + (1 - y_i)\log(1-\pi_i)]} 其中 = 1,如果 = 1和 = -1,如果 = 0。sisis_iyiyiy_isisis_iyiyiy_i 您能直观地向我解释如何解释偏差残差的公式吗? 此外,如果我要选择一个,那一个更合适,为什么呢? 顺便说一句,一些参考文献声称我们基于以下项得出偏差残差 −12ri2−12ri2-\frac{1}{2}{r_i}^2 其中是上面提到的。ririr_i

1
为什么添加滞后效应会增加贝叶斯分层模型中的平均偏差?
背景:我目前正在做一些比较各种贝叶斯层次模型的工作。数据是参与者i和时间j的幸福感的数字量度。我大约有1000位参与者,每位参与者5到10个观察值。ÿ我Ĵÿ一世Ĵy_{ij}一世一世iĴĴj 像大多数纵向数据集一样,我希望看到某种形式的自相关,其中时间上较近的观测值比距离较远的观测值具有更大的相关性。简化几件事,基本模型如下: ÿ我Ĵ〜ñ(μ我Ĵ,σ2)ÿ一世Ĵ〜ñ(μ一世Ĵ,σ2)y_{ij} \sim N(\mu_{ij}, \sigma^2) 我在比较无滞后模型的地方: μ我Ĵ= β0 我μ一世Ĵ=β0一世\mu_{ij} = \beta_{0i} 使用滞后模型: μ我Ĵ= β0 我+ β1个(yi (j − 1 )- β0 我)μ一世Ĵ=β0一世+β1个(ÿ一世(Ĵ-1个)-β0一世)\mu_{ij} = \beta_{0i} + \beta_{1} (y_{i(j-1)} - \beta_{0i}) 其中是一个人级的均值和ββ0 我β0一世\beta_{0i}β1个β1个\beta_1ÿ我0ÿ一世0y_{i0} 我得到的结果表明: 滞后参数约为0.18,95%CI [.14,.21]。即非零 当模型中包含滞后时,平均偏差和DIC都会增加数百 后验预测检查表明,通过包括滞后效应,模型可以更好地恢复数据中的自相关 因此,总的来说,非零滞后参数和后验预测表明滞后模型更好。但均值偏差和DIC表明无滞后模型更好。这让我感到困惑。 我的一般经验是,如果添加有用的参数,则至少应减少平均偏差(即使在复杂度降低后DIC也不会得到改善)。此外,滞后参数的零值将实现与无滞后模型相同的偏差。 题 为什么即使滞后参数不为零并且增加滞后效应,也可以增加贝叶斯分层模型中的平均偏差,从而改善后验预测性检查? 最初的想法 我已经做了很多 收敛性检查(例如,查看轨迹图;检查跨链和跨运行的偏差结果的变化),并且两个模型似乎都收敛于后验。 我已经执行了代码检查,将滞后效应强制为零,这确实恢复了无滞后模型偏差。 我还研究了平均偏差减去惩罚值,该偏差值应使偏差超出预期值,这也使滞后模型显得更糟。 β0iβ0i\beta_{0i} 我如何估计第一次观察之前的隐含时间点可能存在一些问题。 在此数据中,滞后效应可能只是微弱的 我尝试使用lme与的最大相似度来估计模型correlation=corAR1()。滞后参数的估计值非常相似。在这种情况下,与没有滞后的模型相比,滞后模型具有更大的对数可能性和较小的AIC(大约100)(即,它表明滞后模型更好)。因此,这加强了这样的想法,即增加滞后还应降低贝叶斯模型中的偏差。 …

3
在GLM中,饱和模型的对数似然性是否始终为零?
作为广义线性模型输出的一部分,零偏差和残差偏差用于评估模型。我经常看到这些量的饱和模型的对数似然来表示的公式,例如:/stats//a/113022/22199,Logistic回归:如何获取饱和模型 据我所知,饱和模型是完全符合观察到的响应的模型。因此,在我见过的大多数地方,饱和模型的对数似然始终为零。 但是,给出偏差公式的方式表明,有时该量不为零。(好像总是始终为零,为什么还要包括它?) 在什么情况下可以为非零?如果它永远都不为零,为什么要在偏差公式中包括它?

1
线性模型中的R平方与广义线性模型中的偏差成正比?
这是我针对这个问题的上下文:据我所知,使用加权数据和数据survey包时,我们无法在R中运行普通的最小二乘回归。在这里,我们必须使用svyglm(),而不是运行一个广义线性模型(可能是同一件事?在这里我不清楚什么是不同的)。 在OLS中,通过该lm()函数,它可以计算R平方值,我确实理解其解释。但是,svyglm()似乎并没有计算出这个误差,而是给了我一个偏差,我在互联网上的短暂旅行告诉我,这是一种拟合优度度量,其解释与R平方不同。 所以我想我基本上有两个我希望得到指导的问题: 为什么survey似乎无法在Stata中使用加权数据来在包中运行OLS ? 广义线性模型的偏差和r平方值在解释上有什么区别?

2
glmnet包中的偏差度量的确切定义,是否具有交叉验证?
对于当前的研究,我通过二项式因变量通过R中的glmnet包使用Lasso方法。 在glmnet中,可以通过交叉验证找到最佳的lambda,并将生成的模型与各种度量进行比较,例如分类错误或偏差。 我的问题:glmnet中的偏差有多准确?如何计算? (在Friedman等人的相应论文“通过坐标下降的广义线性模型的正则化路径”中,我仅对cv.glmnet中使用的偏差发现了这一评论:“平均偏差(减去左侧的对数似然的两倍数据)”(第17页))。

1
零膨胀泊松或零膨胀负二项式的“偏差”度量?
比例偏差定义为D = 2 *(饱和模型的对数似然度减去拟合模型的对数似然度),通常用作GLM模型中拟合优度的度量。解释的偏差百分比定义为[D(零模型)-D(拟合模型)] / D(零模型),有时也用作线性回归的R平方的GLM模拟。除了ZIP和ZINB分布不属于指数分布的事实外,我很难理解为什么零膨胀建模中未使用比例偏差和百分比偏差。谁能对此有所启发或提供有用的参考?提前致谢!

3
如何评估特定非线性模型的拟合优度?[关闭]
很难说出这里的要求。这个问题是模棱两可,含糊,不完整,过于宽泛或夸张的,不能以目前的形式合理地回答。如需帮助澄清此问题以便可以重新打开, 请访问帮助中心。 7年前关闭。 我有一个非线性模型,其中是标准正态分布的cdf,f是非线性的(请参见下文)。在使用最大似然估计找到之后,我想用参数测试该模型与我的数据的拟合优度。什么是适当的测试?我想使用此测试将不良拟合标记为不良,并确定是否应收集更多数据。Φ 一个(X 1,ÿ 1),(X 2,ÿ 2),... ,(X Ñ,ÿ Ñ)一ÿ= Φ (f(x ,a ))+ εy=Φ(f(x,a))+εy=\Phi(f(x,a)) + \varepsilonΦΦ\Phi一个aa(x1个,ÿ1个),(X2,ÿ2),... ,(xñ,ÿñ)(x1,y1),(x2,y2),…,(xn,yn)(x_1,y_1),(x_2,y_2),\dots,(x_n,y_n)一个aa 我研究了使用偏差的方法,该方法将这个模型与饱和模型进行比较,并使用分布对其适合性进行了相应的检验。这样合适吗?我所阅读的关于偏差的大部分内容都将其应用于GLM,而我所没有的。如果偏差测试是适当的,则需要满足哪些假设才能使测试有效?χ2n − 1χn−12\chi^2_{n-1} 更新:对于,有所帮助。 X>1,一>0f=x−1ax2+1√f=x−1ax2+1f = \frac{x-1}{a\sqrt{x^2+1}}x>1,a>0x>1,a>0x>1,a>0
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.