Questions tagged «quantile-regression»

分位数回归使我们能够估计一组预测变量对结果变量或任何特定分位数的整个分布的影响。

2
有条件分位数回归与无条件分位数回归有什么区别?
Koenker和Basset(1978)针对分位数的条件分位数回归估计器定义为 其中\ rho_ \ tau = u_i \ cdot(\ tau-1(u_i &lt;0))是重新加权功能(称为“检查”功能)残差u_i。τthτth\tau^{th} βˆQR=minb∑i=1nρτ(yi−X′ibτ)β^QR=minb∑i=1nρτ(yi−Xi′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau) ρτ=ui⋅(τ−1(ui&lt;0))ρτ=ui⋅(τ−1(ui&lt;0))\rho_\tau = u_i\cdot (\tau - 1(u_i<0))uiuiu_i 在Firpo等人的论文中。(2009年),作者指出条件分位数回归不会产生有趣的效果。他们说,有条件的结果不能推广到总体(在OLS中,我们始终可以通过迭代期望定律从有条件变为无条件,但这不适用于分位数)。这是因为τthτth\tau^{th}无条件分位数yiyiy_i可能与τthτth\tau^{th}有条件分位数yi|Xiyi|Xiy_i |X_i。 如果我理解正确,那么问题的一部分就是X_i中包含哪些协XiXiX_i变量会对排名变量u_i产生影响,uiuiu_i因为包含协变量会将误差分为观察到的分量和未观察到的分量。我只是不太明白为什么会引起问题。 这是我的问题: 是什么使有条件和无条件分位数效应彼此不同? 如何解释条件分位数回归的系数? 条件分位数回归是否有偏差? 参考文献: Koenker,R。和Bassett,G。(1978)“回归分位数”,《计量经济学》,第1卷。46(1),第33-50页。 Firpo,S。等。(2009)“无条件分位数回归”,《计量经济学》,第1卷。77(3),第953-973页。

1
分位数回归:哪些标准误差?
summary.rq来自quantreg插图的功能为分位数回归系数的标准误差估计提供了多种选择。在哪些特殊情况下,每种情况都变得最佳/理想? 如在Koenker(1994)中所述,“等级”通过反转等级检验产生估计参数的置信区间。默认选项假定错误是iid,而选项iid = FALSE则实施了Koenker Machado(1999)的建议。有关其他参数,请参见rq.fit.br的文档。 假定误差为iid的“ iid”,如KB(1978)所示,计算渐近协方差矩阵的估计。 假定条件分位数函数的局部(以τ为单位)线性(以x为单位)并使用稀疏性的局部估计来计算Huber三明治估计的“ nid”。 “ ker”使用Powell(1990)提出的三明治的核估计。 “ boot”实现了几种可能的用于估计标准错误的自举选项之一。 我已经阅读了至少20篇经验论文,无论是在时间序列还是在横截面尺寸上都应用了该论文,还没有提到标准误差的选择。


2
分位数回归如何“起作用”?
我希望获得分位数回归的直观,易于理解的解释。 假设我有一个简单的结果数据集YYY,以及预测变量。X1,X2X1,X2X_1, X_2 例如,如果我在.25,.5,.75处进行分位数回归,并返回。β0,.25,β1,.25...β2,.75β0,.25,β1,.25...β2,.75\beta_{0,.25},\beta_{1,.25}...\beta_{2,.75} 是ββ\beta可以通过简单地对值进行排序并根据给定分位数附近的示例执行线性回归来找到值?yyy 还是所有样本都随着距离分位数的距离增加而权重下降而对估计有所贡献?ββ\beta 还是完全不同?我尚未找到易于理解的解释。

2
分位数回归:损失函数
我试图理解分位数回归,但是让我受苦的一件事是损失函数的选择。 ρτ(u )= u (τ− 1{ u &lt; 0 })ρτ(ü)=ü(τ-1个{ü&lt;0})\rho_\tau(u) = u(\tau-1_{\{u<0\}}) 我知道的期望最小值等于位数,但是从此功能开始的直观原因是什么?我看不到最小化此功能与分位数之间的关系。有人可以向我解释吗?ρτ(y− u )ρτ(ÿ-ü)\rho_\tau(y-u)τ%τ%\tau\%

2
分位数回归模型是否存在诸如调整后的类的东西?
在论文中包括分位数回归模型后,审稿人希望我在论文中包含调整后的。我已经为我研究的三个感兴趣的分位数计算了伪(来自Koenker和Machado的1999 JASA论文)。[R2[R2R^2[R2[R2R^2 但是,我从未听说过针对分位数回归调整过的,也不知道如何计算。我要求您提供以下任一服务:[R2[R2R^2 优选地:关于如何有意义地计算用于分位数回归的经调整的的公式或方法。[R2[R2R^2 或者:说服论点向审稿人提供为什么分位数回归中不存在调整后的。[R2[R2R^2


2
分位数回归中的R平方
我正在使用分位数回归来找到我数据的90%的预测变量。我正在R中使用该quantreg软件包进行此操作。我如何确定分位数回归的,这将指示预测变量解释了多少可变性?r2r2r^2 我真正想知道的是:“我能用什么方法来解释多少可变性?”。P值的显着性水平在命令输出中可用:summary(rq(formula,tau,data))。我怎样才能得到健康?

3
IV分位数回归文献
在过去的几个月里,我为阅读今年夏天的硕士论文集中阅读了分位数回归。具体来说,我已经阅读了罗杰·科恩克(Roger Koenker)2005年有关该主题的大部分书籍。现在,我想将现有知识扩展到允许工具变量(IV)的分位数回归技术。这似乎是一个活跃的研究领域,并且正在迅速发展。 也许有人可以建议我: 有关IV分位数回归的论文或其他文献 这些不同的统计技术的简要概述 不同技术的利弊 我主要是在寻找文学知识,以使我入门并全面了解现有知识。因此,第一点很重要。第二和第三将是很好!我的兴趣主要在于横截面方法,但也欢迎使用面板方法。 提前致谢。


2
分位数建模中的模型性能
我正在使用分位数回归(例如,通过gbm或quantreg在R中)-不关注中位数,而是关注较高的分位数(例如,第75位)。来自预测建模的背景,我想衡量模型在测试集上的拟合程度,并能够向业务用户进行描述。我的问题是?在具有连续目标的典型设置中,我可以执行以下操作: 计算总体RMSE 根据预测值对数据集进行十进制分析,然后将实际平均值与每个十分位数中预测的平均值进行比较。 等等。 在这种情况下,如果确实没有实际值(至少我不认为)可以与预测进行比较,该怎么办? 这是示例代码: install.packages("quantreg") library(quantreg) install.packages("gbm") library(gbm) data("barro") trainIndx&lt;-sample(1:nrow(barro),size=round(nrow(barro)*0.7),replace=FALSE) train&lt;-barro[trainIndx,] valid&lt;-barro[-trainIndx,] modGBM&lt;-gbm(y.net~., # formula data=train, # dataset distribution=list(name="quantile",alpha=0.75), # see the help for other choices n.trees=5000, # number of trees shrinkage=0.005, # shrinkage or learning rate, # 0.001 to 0.1 usually work interaction.depth=5, # 1: additive model, …

2
向非统计学家解释分位数回归
我最近向心理学杂志提交了一篇论文,其中我使用了分位数回归。尽管我以为我已经对分位数回归进行了清晰的阐述,但审阅者要求对分位数回归技术仅熟悉标准OLS回归进行更好的解释。 那么,在经验论文中,向非统计学家解释分位数回归的最佳方法是什么?

2
分位数回归预测
我对某些模型使用分位数回归很感兴趣,但想对使用此方法可以实现的目标进行一些说明。我知道我可以对IV / DV 关系进行更可靠的分析,尤其是在遇到离群值和异方差的情况下,但在我的情况下,重点是预测。 特别是,我有兴趣提高模型的拟合度,而不求助于更复杂的非线性模型甚至分段线性回归。在预测时,是否可以根据预测变量的值选择最高概率的结果分位数?换句话说,是否可以根据预测变量的值确定每个预测结果的分位数概率?

2
如何用单纯形法求解最小绝对偏差?
argminwL(w)=∑ni=1|yi−wTx|arg⁡minwL(w)=∑i=1n|yi−wTx| \underset{\textbf{w}}{\arg\min} L(w)=\sum_{i=1}^{n}|y_{i}-\textbf{w}^T\textbf{x}| min∑ni=1uimin∑i=1nui\min \sum_{i=1}^{n}u_{i} ui≥xTw−yii=1,…,nui≥xTw−yii=1,…,nu_i \geq \textbf{x}^T\textbf{w}- y_{i} \; i = 1,\ldots,n ui≥−(xTw−yi)i=1,…,nui≥−(xTw−yi)i=1,…,nu_i \geq -\left(\textbf{x}^T\textbf{w}-y_{i}\right) \; i = 1,\ldots,n 但是我不知道要逐步解决它,因为我是LP的新手。你有什么主意吗?提前致谢! 编辑: 这是我已解决此问题的最新阶段。我正在尝试按照以下说明解决问题: 步骤1:将其制成标准格式 minZ=∑ni=1uiminZ=∑i=1nui\min Z=\sum_{i=1}^{n}u_{i} xTw−ui+s1=yii=1,…,nxTw−ui+s1=yii=1,…,n \textbf{x}^T\textbf{w} -u_i+s_1=y_{i} \; i = 1,\ldots,n xTw+ui+s2=−yii=1,…,nxTw+ui+s2=−yii=1,…,n \textbf{x}^T\textbf{w} +u_i+s_2=-y_{i} \; i = 1,\ldots,n 服从s1≥0;s2≥0;ui≥0 i=1,...,ns1≥0;s2≥0;ui≥0 i=1,...,ns_1 \ge 0; s_2\ge 0; u_i \ge 0 …

1
Logistic分位数回归–如何最好地传达结果
在上一篇文章中,我想知道如何处理EQ-5D分数。最近,我偶然发现了由Bottai和McKeown建议的逻辑分位数回归,该回归引入了一种处理有限结果的优雅方法。公式很简单: 升Ò 克我吨(ÿ)= 升Ô 克(y- ÿ中号我Ñÿ中号一个X- ÿ)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) 为避免log(0)和被0除,可以将范围扩展一个小值。这提供了尊重分数边界的环境。ϵϵ\epsilon 问题在于,任何都将处于对数刻度,除非转换回常规刻度才有意义,但这意味着将是非线性的。出于图形目的,这并不重要,但如果使用更多:s,则将非常不便。β βββ\betaββ\betaββ\beta 我的问题: 您如何建议在不报告整个跨度的情况下报告logit?ββ\beta 实施实例 为了测试实现,我基于此基本功能编写了一个仿真: Ò ù 吨Ç ø 米Ë = β0+ β1个* x t e s t3+ β2* 小号Ë Xoutcome=β0+β1∗xtest3+β2∗sexoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex 其中,和。由于分数是有上限的,因此我将大于4的任何结果值和小于-1的任何结果值设置为最大值。β 1 = 0.5 β 2 = 1β0= 0β0=0\beta_0 = 0β1个= 0.5β1=0.5\beta_1 = 0.5β2= 1β2=1\beta_2 = 1 模拟数据 set.seed(10) …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.