Questions tagged «fixed-effects-model»

在生物统计学中,固定效应可能意味着人口平均效应。在计量经济学中,固定效应可以用解释变量表示观察到的数量,这些解释变量被视为非随机量。

3
从三向方差分析表中删除因子
在最近的一篇论文中,我安装了一个三向固定效果模型。由于其中一个因素并不重要(p> 0.1),因此我将其删除,并使用两个固定的效果和一个相互作用对模型进行了重新拟合。 我刚刚让裁判发表评论,引用一下: 时间不是三方方差分析的重要因素,本身也不是汇集时间因素的充分标准:关于此问题的标准文本(Underwood 1997)认为,非显着影响的p值必须为大于0.25才能合并一个因子的治疗水平。作者应在此处给出相关的p值,并参考Underwood 1997证明其合并的合理性。 我的问题是: 我从未听说过0.25规则。还有其他人吗?我可以理解的是,如果p值接近临界值,则无法删除该因素,但是拥有“规则”似乎有点极端。 这位裁判指出,Underwood 1997是标准文本。真假的啊?我从来没听说过。标准文本是什么(是否存在这样的东西)?不幸的是,我无法访问1997年的Underwood。 对裁判的任何建议。 背景:本文已提交给非统计期刊。当拟合三向模型时,我检查了交互作用。

1
面板数据模型中一组内的标准化因变量?
在识别组中对因变量进行标准化是否有意义? 以下工作文件(法律亚马逊地区的森林砍伐放缓;价格或政策?,pdf)使用标准化的因变量来分析巴西总体政策变化对森林砍伐的影响。 标准化按如下方式完成: Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} 作者认为,这是为了“考虑市政当局内森林砍伐增量的相对变化”。作者特此使用面板数据的有限元估计(第12页)。新法律出台后的每一年都应包括一个后政策假人。 如果以这种方式标准化因变量,应该如何解释系数? 标准化不是非正统的吗,因为它为群体/市镇随时间变化较小的观测值提供了更高的价值?

3
固定效果何时真正固定?
考虑以下类型的线性不可观察效应模型: 其中,是不可观察但时不变的特征,是误差,和分别索引个人观察和时间。固定效应(FE)回归中的典型方法是通过单个假人(LSDV)/去义或通过首次求差来消除。 Ç ë 我吨Ç 我ÿ我Ť= X我Ťβ+ c一世+ e我Ťyit=Xitβ+ci+eity_{it} = X_{it}\beta + c_{i} + e_{it}CccËee一世iiŤttC一世cic_{i} 我一直想知道的是:何时真正被“修复”?C一世cic_{i} 这可能是一个琐碎的问题,但由于其背后的原因,让我举两个例子。 假设我们采访的人今天并要求她的收入,重量等,所以我们得到我们的。在接下来的10天里,我们去找那个人并且每天再次与她面谈,因此我们有关于她的面板数据。我们是否应将这10天未观察到的特征视为固定的,以确保它们将来会在其他某个时候发生变化?在10天之内,她的个人能力可能不会改变,但是随着年龄的增长,这种能力就会改变。或以一种更极端的方式问:如果我每天在10个小时内每小时采访一次此人,那么她的“未察觉”特征很可能会在“样本”中得到固定,但这有什么用呢?XXX 现在,假设我们从一个人的生命开始到生命终结,每个月都要进行约85年的采访。这段时间将保持什么固定状态?出生地,性别和眼睛颜色最有可能,但除此之外,我几乎没有别的想法。但更重要的是:如果某项特征在她的生活中的某个时刻发生了变化,但变化却无限小,该怎么办?然后,它不再是固定的效果,因为在实践中,此特性是准固定的,它已经改变了。 从统计角度来看,什么是固定效果是相对清楚的,但是从直觉角度来看,这是我很难理解的。也许其他人以前有过这些想法,并提出了关于何时固定效应确实是固定效应的争论。我非常感谢您对此主题的其他想法。

3
Mundlak固定效应程序是否适用于假人的逻辑回归?
我有一个包含8000个聚类和400万个观测值的数据集。不幸的是xtlogit,即使使用10%的子样本,我的统计软件Stata在使用其面板数据函数进行logistic回归时运行也相当缓慢。 但是,使用非面板logit功能时,结果会更快出现。因此,我可能会受益于使用logit修正后的数据来解决固定效应。 我相信该程序是“ Mundlak固定效应程序”的创造(Mundlak,Y。1978年。时间序列和横截面数据的合并。Econometrica,46(1),69-85)。 我在Antonakis,J.,Bendahan,S.,Jacquart,P.,&Lalive,R.(2010)的论文中找到了对此过程的直观解释。关于提出因果主张:审查和建议。《领导力季刊》 21(6)。1086-1120。我引用: 解决遗漏固定效应问题并仍然包含2级变量的一种方法是将所有1级协变量的聚类均值包括在估计模型中(Mundlak,1978)。聚类平均值可以作为回归变量包括在内,也可以从1级协变量中减去(即聚类平均居中)。聚类均值在聚类内是不变的(并且在聚类之间有所不同),并且允许对一级参数进行一致的估计,就像已包含固定效应一样(参见Rabe-Hesketh和Skrondal,2008年)。 因此,聚类平均居中似乎是解决我的计算问题的理想选择。但是,这些论文似乎是针对线性回归(OLS)的。 这种聚类平均居中的方法是否也适用于“复制”固定效应二进制逻辑回归? 一个更技术性的问题应该得出相同的答案:当数据集B是数据集A的均值中心版本时,数据集A是否xtlogit depvar indepvars, fe等于logit depvar indepvars数据集B? 我在这种聚类均值居中发现的另一个困难是如何应对假人。由于虚拟变量为0或1,它们在随机效应和固定效应回归中是否相同?他们不应该“居中”吗?

1
PROC Mixed和LME / LMER在R自由度上的区别
注意:这个问题是一个转贴,因为我的上一个问题出于法律原因不得不删除。 在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时,我偶然发现了一些相当混乱的差异。更具体地说,不同测试的自由度在PROC MIXED和之间有所不同lme,我想知道为什么。 从以下数据集(以下给出的R代码)开始: ind:指示进行测量的个人的因子 fac:进行测量的器官 trt:表示治疗的因素 y:一些连续响应变量 这个想法是建立以下简单模型: y ~ trt + (ind):ind作为随机因子 y ~ trt + (fac(ind)):fac嵌套在ind作为随机因子 需要注意的是最后一个模型应引起奇异性,因为只有1的值y对每一个组合ind和fac。 第一模型 在SAS中,我建立以下模型: PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程,R中使用的相同模型nlme应为: > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计,但是在对F的影响进行F检验时trt,它们使用的自由度不同: SAS : Type …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
各个级别面板数据之间的差异
用单个级别面板数据指定差异模型中差异的正确方法是什么? 这里是设置:假设我在城市中嵌入了多年的个人级别面板数据,并且处理方式在城市年份级别上有所不同。形式上,让为个别的结果在城市和年和对是否干预影响城市的虚拟在一年。典型的DiD估算器(例如Bertrand等人(2004,第250页)中概述的估算器)基于简单的OLS模型,其中具有针对城市和年份的固定影响项:我小号吨d 小号吨小号吨ÿ我小号Ťÿ一世sŤy_{ist}一世一世isssŤŤtd小号ŤdsŤD_{st}sssŤŤt yist=As+Bt+cXist+βDst+ϵistÿ一世sŤ=一种s+乙Ť+CX一世sŤ+βdsŤ+ϵ一世sŤ y_{ist} = A_{s} + B_t + cX_{ist} + \beta D_{st} + \epsilon_{ist} 但是,该估计量是否忽略了个人层面的面板结构(即,对城市中每个人的多次观察)?用个体水平的固定效应项扩展该模型是否有意义?许多DiD应用程序使用重复的横截面数据,而没有单独级别的面板数据。Si小号一世S_i Bertrand,Marianne,Esther Duflo和Sendhil Mullainathan。2004年。“我们应该相信差异差异估计有多少?” 经济学季刊119(1):249–75。

2
为什么随机效应模型要求效应与输入变量不相关,而固定效应模型却允许相关性?
来自维基百科 关于个体特定效应,有两个共同的假设,即随机效应假设和固定效应假设。随机效应假设(在随机效应模型中做出)是各个特定效应与自变量不相关。固定效应假设是个体特定效应与自变量相关。如果随机效应假设成立,则随机效应模型比固定效应模型更有效。但是,如果该假设不成立(即,如果Durbin-Watson检验失败),则随机效应模型将不一致。 我想知道为什么随机效果模型要求随机效果与输入变量不相关,而固定效果模型允许效果与输入变量相关? 谢谢!

1
如何处理固定效应模型中遗漏的虚拟变量?
我使用的是固定效应模型为我的面板数据(9岁,1000+ OBS),由于我的豪斯曼测试指示的值。当我为公司所包括的行业添加虚拟变量时,它们总是被忽略。我知道不同行业群体之间的DV(披露指数)差异很大。但是在使用Stata时,我无法在模型中使用它们。(Pr &gt; χ2)&lt; 0.05(P[R&gt;χ2)&lt;0.05(Pr>\chi^2)<0.05 有什么建议如何解决这个问题?又为什么省略它们?

2
在纵向研究中估计平均治疗效果的最佳方法是什么?
在一项纵向研究中,在时间点上重复测量了单位结果,总共有固定的测量时机(固定=单位测量同时进行)。我吨米Yitÿ一世ŤY_{it}i一世itŤtm米m 将单位随机分配给治疗或对照组。我想估计和测试平均治疗效果,即其中期望是跨时间和跨个人的。为此,我考虑使用固定时间的多层次(混合效果)模型:G = 0 A T E = E (Y | G = 1 )− E (Y | G = 0 ),G=1G=1个G=1G=0G=0G=0ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yit=α+βGi+u0i+eitYit=α+βGi+u0i+eitY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} 与截距,的,横跨单元的无规截距,和残留。β 甲Ť é ù ëαα\alphaββ\betaATEATEATEuuueee 现在我正在考虑替代模型 Yit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itYit=β~Gi+∑j=1mκjdiĴ+∑Ĵ=1个米γĴd一世ĴG一世+ü〜0一世+Ë〜一世ŤY_{it} = \tilde{\beta} G_i + \sum_{j=1}^m …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.