Questions tagged «econometrics»

计量经济学是统计领域,涉及经济学的应用。

4
如何在固定效果模型中保持时间不变变量
我有一家大型意大利公司10年以上员工的数据,我想看看随着时间的推移,男女收入差距中的性别差异是如何变化的。为此,我运行池OLS: ,其中y是每年的对数收入,X i t包括因个体和时间而异的协变量,d t是年份假人,如果工人是男性,则m a l e i等于1,否则为零。yit=X′itβ+δmalei+∑t=110γtdt+εityit=Xit′β+δmalei+∑t=110γtdt+εit y_{it} = X'_{it}\beta + \delta {\rm male}_i + \sum^{10}_{t=1}\gamma_t d_t + \varepsilon_{it} yyyXitXitX_{it}dtdtd_tmaleimalei{\rm male}_i 现在,我担心某些协变量可能与未观察到的固定效应相关。但是,当我使用固定效应(内部)估算器或初次差异时,我失去了性别虚拟对象,因为该变量不会随时间变化。我不想使用随机效应估计器,因为我经常听到人们说它提出的假设非常不现实,不太可能成立。 有什么方法可以同时保持性别虚拟和控制固定效果?如果有办法,我是否需要对性别变量的假设检验进行聚类或照顾其他带有错误的问题?

3
Frisch-Waugh定理的效用
我应该教计量经济学的弗里什·沃夫定理,但我还没有研究过。 我已经了解了其背后的数学原理,也希望这个想法“如果您“消除”其他回归变量的影响,则从多重线性模型中为特定系数获得的系数等于简单回归模型的系数”。因此,理论上的想法有点酷。(如果我完全误解了,我欢迎您提出更正) 但是它有一些经典/实用用法吗? 编辑:我已经接受了一个答案,但仍然愿意有新的带来其他示例/应用程序。

5
时间序列计量经济学和面板数据计量经济学有什么区别?
这个问题可能很幼稚,但是如果时间序列方法和面板数据方法之间存在差异,那么我对计量经济学的教学方式就会感到困惑。 关于时间序列,我涵盖了诸如协方差平稳,AR,MA等主题。关于面板数据,我只看到了固定效应与随机效应(或更笼统地说是分层模型),差异-差异等 这些主题是否在某些方面相关?由于面板数据也具有时间维度,因此为什么也没有讨论AR,MA等问题? 如果答案是我对面板方法的教育还远远不够,那么您能指出一本书不仅仅涉及FE / RE和差异吗?

2
空间自相关与空间平稳性
假设我们在二维空间中有点,并且我们希望测量属性对属性。典型的线性回归模型当然是 XXXyyyy=Xβ+ϵy=Xβ+ϵy= X\beta + \epsilon 这里有两个问题:第一个是ϵϵ\epsilon项可能在空间上相关(违反独立且相同的误差假设),第二个是回归斜率可能在整个空间中变化。可以通过将空间滞后项纳入模型来解决第一个问题,如 y=ρWy+Xβ+ϵy=ρWy+Xβ+ϵy=\rho W y + X\beta + \epsilon 我们甚至可以将LeSage和Pace所描述的空间Durbin模型与空间自回归遗漏变量(空间固定效应)结合在一起 y=ρWy+Xβ+WXλ+ϵy=ρWy+Xβ+WXλ+ϵy=\rho W y + X\beta + WX\lambda + \epsilon 其中ρρ\rho是权重矩阵W控制的空间相关强度WWW。显然,空间滞后的形式将取决于对空间相关形式的假设。 第二个问题已使用“地理加权回归”(GWR)解决,该技术我并不熟悉,但Brunsdon等人对此进行了解释。(1998)。据我所知,它涉及对加权子区域拟合一组回归模型,从而获得每个\ beta_i的估计值,这些\ beta_iβiβi\beta_i根据其空间而变化, β^i=(XTWiX)−1XTWiyβ^i=(XTWiX)−1XTWiy\hat{\beta}_i = (X^TW_iX)^{-1}X^T W_i y ,其中WWW是另一个空间权重矩阵,不一定与上面的矩阵不同。 我的问题:第一种方法(空间自回归)是否不足以对对的平均边际效应进行无偏估计?GWR似乎过拟合:当然会在空间中变化,但是如果我们想知道某种疗法的平均预期效果而又不考虑其空间位置,那么GWR可以做出什么贡献?XXXyyyββ\beta 这是我对初始答案的尝试: 如果我想知道特定邻里额外一间卧室的价格,似乎GWR是我最好的选择。 如果我想知道一间额外卧室的全球平均保费,我应该使用空间自回归技术。 很想听听其他观点。

2
金融/经济学研究中不规则的时间序列
在金融计量经济学研究中,以每日数据的形式调查金融时间序列之间的关系非常普遍。例如,通常通过取对数差将变量设为;LN (P 吨)- LN (P 吨- 1)。I(0)I(0)I(0)ln(Pt)−ln(Pt−1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) 但是,每日数据意味着有555每周数据点,而星期六和星期日则丢失。在我所知道的应用文献中,这似乎没有提及。这是我根据观察得出的一些密切相关的问题: 即使金融市场在周末休市,这是否也属于不规则间隔的数据? 如果是这样,那么迄今为止,大量的忽略该问题的论文对现有经验结果的有效性有何影响?

5
贝叶斯计量经济学教科书
我正在寻找一本关于贝叶斯计量经济学的理论上严格的教科书,假定对频密主义计量经济学有扎实的理解。 我想为每个答案建议一项工作,以便可以单独对建议进行投票或否决。


2
为什么经济学研究人员对二元响应变量使用线性回归?
最近,我不得不阅读几篇经济学方面的论文(我不太熟悉这一领域)。我注意到的一件事是,即使响应变量是二进制的,使用OLS拟合的线性回归模型也无处不在。因此,我的问题是: 为什么在经济学领域,线性回归优于逻辑回归?这是简单的普遍做法,还是(在论文,教师等中)积极倡导的程序? 请注意,我并不是在问为什么将线性回归与二元响应一起使用可能不是一个好主意,或者是什么替代方法。相反,我问为什么人们在这种情况下使用线性回归,因为我知道这两个问题的答案。

2
微观计量经济学中的因果关系与时间序列计量经济学中的格兰杰因果关系
我了解微观经济学(尤其是IV或回归不连续性设计)中使用的因果关系,以及时间序列计量经济学中使用的Granger因果关系。如何将彼此联系起来?例如,我已经看到两种方法都用于面板数据(例如,T = 20)。在这方面对论文的任何引用将不胜感激。ñ= 30N=30N=30Ť= 20T=20T=20

1
刚刚确定的2SLS中位数是无偏的吗?
在《最无害的计量经济学:经验主义者的同伴》中(Angrist and Pischke,2009:第209页),我读到以下内容: (...)实际上,刚刚确定的2SLS(即简单的Wald估计量)几乎是无偏的。这很难正式显示,因为刚刚确定的2SLS没有任何时刻(即,采样分布有粗尾)。但是,即使仪器较弱,刚刚确定的2SLS也会大致居中。因此,我们说刚刚确定的2SLS是中值无偏的。(...) 虽然作者说是刚刚确定的2SLS是中位数,不带偏见,他们既没有证实,也没有提供一个参考的证据。他们在第213页再次提到了该命题,但没有提及证明。另外,我在麻省理工学院第22页的关于工具变量的讲义中找不到提出这一主张的动机。 原因可能是该提议是错误的,因为他们在博客的注释中拒绝了该提议。但是,他们写道,刚刚确定的2SLS 近似为中值。他们使用一个小型的蒙特卡洛实验来激发这一点,但没有提供分析证明或与近似值相关的误差项的封闭式表达。无论如何,这是作者对密歇根州立大学教授Gary Solon的答复,他评论说刚刚确定的2SLS 并非中性的。 问题1:如何证明刚刚确定的2SLS 并不像Gary Solon所说的那样是中性的? 问题2:如Angrist和Pischke所论,您如何证明刚刚确定的2SLS 近似中值无偏? 对于问题1,我正在寻找一个反例。对于问题2,我(主要)是在寻找证明或参考证明。 在这种情况下,我也在寻找中值无偏差的正式定义。我理解这个概念如下:估计器θ(X 1 :Ñ)的θ基于某些设定的X 1 :ñ的Ñ随机变量是中值无偏为θ当且仅当的分布θ(X 1 :n)具有中值θ。θ^(X1:n)θ^(X1:n)\hat{\theta}(X_{1:n})θθ\thetaX1:nX1:nX_{1:n}nnnθθ\thetaθ^(X1:n)θ^(X1:n)\hat{\theta}(X_{1:n})θθ\theta 笔记 在刚刚确定的模型中,内生回归变量的数量等于工具数量。 {YX=Xβ+Wγ+u=Zδ+Wζ+v(1)(1){Y=Xβ+Wγ+uX=Zδ+Wζ+v\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{cases}\tag{1}XXXk×n+1k×n+1k\times n+1kkkk×n+1k×n+1k\times n+1ZZZWWWuuuvvv ββ\beta(1)(1)(1)XXXZZZWWWX^X^\hat{X}YYYX^X^\hat{X}WWWX^X^\hat{X}ββ\beta yi=α+βxi+uiyi=α+βxi+uiy_i=\alpha+\beta x_i+u_ixixix_iziziz_iββ\betaβ^2SLS=sZYsZX,(2)(2)β^2SLS=sZYsZX,\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},sABsABs_{AB}AAABBB(2)(2)(2)β^2SLS=∑i(yi−y¯)zi∑i(xi−x¯)zi=β+∑i(ui−u¯)zi∑i(xi−x¯)zi(3)(3)β^2SLS=∑i(yi−y¯)zi∑i(xi−x¯)zi=β+∑i(ui−u¯)zi∑i(xi−x¯)zi\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}y¯=∑iyi/ny¯=∑iyi/n\bar{y}=\sum_iy_i/nx¯=∑ixi/nx¯=∑ixi/n\bar{x}=\sum_i x_i/nu¯=∑iui/nu¯=∑iui/n\bar{u}=\sum_i u_i/nnnn 我进行了文献搜索,使用“正当识别”和“中位数无偏”一词来查找回答问题1和2的参考文献(请参见上文)。我什么都没找到。我发现(见下文)的所有文章都提到Angrist和Pischke(2009:第209、213页)时指出刚确定的2SLS是中值无偏的。 Jakiela,P.,Miguel,E.,&Te Velde,VL(2015)。您已经赢得了它:估算人力资本对社会偏好的影响。实验经济学,18(3),385-407。 An,W.(2015年)。工具变量估计社交网络中的对等效应。社会科学研究,50,382-394。 Vermeulen,W.和Van Ommeren,J.(2009)。土地利用规划会影响区域经济吗?同时分析了荷兰的住房供应,内部移民和当地就业增长。住房经济学杂志,18(4),294-310。 Aidt,TS,&Leon,G.(2016年)。民主的机会之窗:撒哈拉以南非洲骚乱的证据。冲突解决杂志,60(4),694-717。



2
不同的AIC定义
在Wikipedia中,Akaike的信息标准(AIC)的定义为,其中是参数的数量,是模型的对数似然性。AIC=2k−2logLAIC=2k−2log⁡L AIC = 2k -2 \log L kkklogLlog⁡L\log L 但是,我们的计量经济学家在一家备受尊敬的大学中指出,。这里是ARMA模型中误差的估计方差,是时间序列数据集中观测值的数量。AIC=log(σ^2)+2⋅kTAIC=log⁡(σ^2)+2⋅kT AIC = \log (\hat{\sigma}^2) + \frac{2 \cdot k}{T} σ^2σ^2 \hat{\sigma}^2 TT T 后一个定义是否等同于第一个定义,但仅针对ARMA模型进行了调整?还是两个定义之间存在某种冲突?

4
可以使用ARIMA对趋势平稳序列进行建模吗?
我对使用ARIMA(X)进行建模所需的平稳序列有疑问/困惑。我在推理(干预效果)方面考虑的更多,但我想知道预测与推理是否会对响应产生任何影响。 题: 我阅读的所有介绍性资源都指出该系列需要固定下来,这对我来说很有意义,这就是有马中的“ I”出现的地方(与众不同)。 让我感到困惑的是,ARIMA(X)中趋势和漂移的使用以及对平稳需求的暗示(如果有)。 使用常数/漂移项和/或趋势变量作为外生变量(即加“ t”作为回归变量)是否否定了序列是平稳的要求?答案是否不同取决于序列是否具有单位根(例如adf检验)或具有确定性趋势但没有单位根? 要么 在使用ARIMA(X)之前,通过微分和/或去趋势使序列始终保持静止吗?

5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.