Questions tagged «econometrics»

计量经济学是统计领域,涉及经济学的应用。

9
计量经济学与其他统计领域之间在哲学,方法论和术语上的主要区别是什么?
计量经济学与传统统计学有很大的重叠,但是经常使用它自己的术语来表示各种主题(“标识”,“外生”等)。我曾经听过另一领域的一位应用统计学教授的评论,该术语经常是不同的,但是概念是相同的。但是它也有自己的方法和哲学上的区别(想到了赫克曼的著名论文)。 计量经济学与主流统计之间存在哪些术语差异?这些领域在哪些方面会发生变化,而不仅仅是术语?

8
R语言在经济学领域是否可靠?
我是经济学的研究生,最近从其他非常著名的统计软件包转换为R(我主要使用SPSS)。目前,我的小问题是我是班上唯一的R用户。我的同学使用Stata和Gauss,我的一位教授甚至说R是工程学的理想选择,而不是经济学的理想选择。他说,许多软件包是由对编程了解很多但对经济学了解不多的人构建的,因此并不可靠。他还提到了这样一个事实,因为构建R包实际上不涉及任何金钱,因此没有动机去正确地完成它(例如,与Stata不同),并且他使用R一段时间并在其中获得了一些“荒谬”的结果。他尝试估算一些东西。此外,他抱怨说自己在R中使用了随机数生成器,他说这是“ 我使用R仅仅一个多月了,我必须说我爱上了它。我从教授那里听到的所有这些东西只是让我沮丧。 所以我的问题是:“ R在经济学领域是否可靠?”。

5
计量经济学中的“随机效应模型”与计量经济学之外的混合模型有何关系?
我曾经认为计量经济学中的“随机效应模型”对应于计量经济学之外的“带有随机截距的混合模型”,但是现在我不确定。可以? 计量经济学使用的“固定效应”和“随机效应”等术语与混合模型的文献有些不同,这引起了众所周知的混乱。让我们考虑一个简单的情况,其中yyy线性依赖于xxx但是在不同的测量组中截距不同: yit=βxit+ui+ϵit.yit=βxit+ui+ϵit.y_{it} = \beta x_{it} + u_i + \epsilon_{it}. 在这里,每个单位/组iii在不同的时间点观察到ttt。计量经济学家称其为“面板数据”。 在混合模型术语中,我们可以将uiuiu_i视为固定效应或随机效应(在这种情况下,它是随机截距)。把它当作固定装置嵌合β和ü我以最小化均方误差(即运行OLS回归与虚设组变量)。处理它,我们还假定作为随机手段ü 我〜Ñ(Û 0,σ 2 ù),并使用最大可能性,以适应ü 0和σ 2 Ù代替各嵌合ù 我β^β^\hat \betau^iu^i\hat u_iui∼N(u0,σ2u)ui∼N(u0,σu2)u_i\sim\mathcal N(u_0,\sigma^2_u)u0u0u_0σ2uσu2\sigma^2_uuiuiu_i在其自己的。这导致“局部集中”的效应,其中估计ü我得到朝缩水它们的平均ü 0。u^iu^i\hat u_iu^0u^0\hat u_0 R formula when treating group as fixed: y ~ x + group R formula when treating group as random: y ~ x + (1|group) …

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
什么是差异中的差异?
长期以来,差异一直作为非实验性工具而流行,尤其是在经济学中。有人可以对以下有关差异的问题提供清晰且非技术性的答案。 什么是差异估算器? 为什么使用差异中差异估算器? 我们真的可以相信差异差异估计吗?

5
机器学习对理解因果关系是否有用,从而对社会科学也没那么有趣?
我对机器学习/其他统计预测技术与社会科学家(例如,经济学家)使用的统计类型之间的区别的理解是,经济学家似乎对理解单个或多个变量的影响非常感兴趣-都在幅度并检测该关系是否为因果关系。为此,您最终会用实验和准实验方法等来关注自己。 可以预测的机器学习或统计建模通常会完全忽略这一方面,并​​且在许多情况下并不能给您提供一个变量会影响结果的特定程度(logit和probit似乎都可以)。 一个相关的问题是,在预测新领域时,理论上启发的经济或行为模型在何种程度上比理论模型具有优势?机器学习或面向预测的统计学家会对批评说什么:没有经济模型,您将无法正确预测协变量非常不同的新样本。 我很高兴听到人们从各个角度对此采取的态度。




1
从lmer模型计算效果的可重复性
我刚刚碰到了这篇论文,该论文描述了如何通过混合效应建模来计算测量的可重复性(又称可靠性,又称类内相关性)。R代码为: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
自由度可以是非整数吗?
当我使用GAM时,它给了我剩余的DF为(代码的最后一行)。这意味着什么?超越GAM示例,通常,自由度可以是非整数吗?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 


6
为什么在拟合模型时通常选择最小化平方误差之和(SSE)?
问题很简单:为什么当我们尝试将模型拟合到线性或非线性数据时,我们通常会尝试最小化误差平方和以获得模型参数的估计量吗?为什么不选择其他一些目标函数来最小化?我了解,由于技术原因,二次函数比其他函数(例如,绝对偏差之和)更好。但这仍然不是一个很令人信服的答案。除了这个技术原因之外,为什么人们特别赞成这种“欧几里得类型”的距离函数?是否有特定的含义或解释? 我的想法背后的逻辑如下: 当有了数据集时,首先要通过建立一组功能或分布假设(例如,某个时刻条件,而不是整个分布)来建立模型。在您的模型中,有一些参数(假设它是一个参数模型),那么您需要找到一种方法来一致地估计这些参数,并且希望您的估计器具有低方差和一些其他好的属性。无论您最小化SSE或LAD还是其他一些目标函数,我都认为它们只是获得一致估计量的不同方法。按照这种逻辑,我认为人们使用的最小二乘必须为1)它会产生模型的一致估计量2)其他我不知道的东西。 在计量经济学中,我们知道在线性回归模型中,如果您假设误差项对预测变量的均值条件为0,并且均方差和误差互不相关,那么最小化平方误差之和将为您提供模型的一致估计参数和高斯-马尔可夫定理,这个估计是蓝色。因此,这表明如果选择最小化不是SSE的某些其他目标函数,则无法保证将获得模型参数的一致估计量。我的理解正确吗?如果正确,那么可以通过一致性来证明最小化SSE而不是其他一些目标函数,这是可以接受的,实际上,这比说二次函数更好是可以接受的。 在实践中,我实际上看到许多情况,人们直接最小化平方误差之和,而没有先明确指定完整模型,例如误差项的分布假设(矩假设)。然后在我看来,该方法的用户只是想看看数据在平方距离函数方面与“模型”的拟合程度如何(我使用引号,因为模型假设可能不完整)。 一个相关的问题(也与该网站有关)是:为什么当我们尝试使用交叉验证比较不同的模型时,我们是否再次使用SSE作为判断标准?即,选择具有最小SSE的模型?为什么没有其他标准?

2
PCA和渐近PCA有什么区别?
在1986年和1988年的两篇论文中,Connor和Korajczyk提出了一种建模资产收益的方法。由于这些时间序列通常具有比时间段观察更多的资产,因此他们建议对资产收益的横截面协方差执行PCA。他们称此方法为渐近主成分分析(APCA,这很令人困惑,因为听众立即想到PCA的渐近性质)。 我已经计算出方程,这两种方法在数值上似乎是等效的。渐近性当然是不同的,因为证明了收敛是而不是。我的问题是:有人使用过APCA并将其与PCA相比吗?有具体的区别吗?如果是这样,哪个?N→∞N→∞N \rightarrow \inftyT→∞T→∞T \rightarrow \infty
23 pca  econometrics 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.