固定效果何时真正固定?


12

考虑以下类型的线性不可观察效应模型: 其中,是不可观察但时不变的特征,是误差,和分别索引个人观察和时间。固定效应(FE)回归中的典型方法是通过单个假人(LSDV)/去义或通过首次求差来消除。 Ç ë Ç

yit=Xitβ+ci+eit
ceitci

我一直想知道的是:何时真正被“修复”?ci

这可能是一个琐碎的问题,但由于其背后的原因,让我举两个例子。

  1. 假设我们采访的人今天并要求她的收入,重量等,所以我们得到我们的。在接下来的10天里,我们去找那个人并且每天再次与她面谈,因此我们有关于她的面板数据。我们是否应将这10天未观察到的特征视为固定的,以确保它们将来会在其他某个时候发生变化?在10天之内,她的个人能力可能不会改变,但是随着年龄的增长,这种能力就会改变。或以一种更极端的方式问:如果我每天在10个小时内每小时采访一次此人,那么她的“未察觉”特征很可能会在“样本”中得到固定,但这有什么用呢?X

  2. 现在,假设我们从一个人的生命开始到生命终结,每个月都要进行约85年的采访。这段时间将保持什么固定状态?出生地,性别和眼睛颜色最有可能,但除此之外,我几乎没有别的想法。但更重要的是:如果某项特征在她的生活中的某个时刻发生了变化,但变化却无限小,该怎么办?然后,它不再是固定的效果,因为在实践中,此特性是准固定的,它已经改变了。

从统计角度来看,什么是固定效果是相对清楚的,但是从直觉角度来看,这是我很难理解的。也许其他人以前有过这些想法,并提出了关于何时固定效应确实是固定效应的争论。我非常感谢您对此主题的其他想法。


2
+1,好问题和好答案。也许值得记住,"all models are wrong, but some are useful"- 乔治·博克斯George Box)
gung-恢复莫妮卡

我可能混淆这一点,但不是连续:1)如果作为都是一样的对待,你有一个汇集模型,2)如果作为同一治疗所有(组的虚拟变量,可能包括“年”或“天”),则具有FE模型; 3)如果将视为分布,则具有RE模型。请参阅:userwww.service.emory.edu/~tclark7/randomeffects.pdf i c i z j [ i ] c j [ i ]ciicizj[i]cj[i]
韦恩

Answers:


9

如果您对这种关于因果推断的公式感兴趣,则表示的未知量仅在研究期间/用于确定相关因果的固定效应的数据中稳定。 Ç βci

如果您担心表示的数量即使在此期间也不稳定,则固定效果将无法满足您的要求。然后你可以使用随机效应代替,但如果你希望随机之间的相关和你要条件上在多级设置。对这种相关性的关注通常是采用固定效果公式的动机之一,因为在很多(但不是全部)情况下,您不必担心这一点。Ç X Ç ˉ XciciXiciX¯i

简而言之,您对由表示的数量变化的担忧是非常合理的,但是主要是因为它会影响您拥有的时期而不是您可能拥有的时期或最终可能拥有但没有的时期的数据。ci


+1我喜欢这个答案。但是,在采样期间应该修复的东西的微小变化怎么办?如果我的人在10天的样本中在第6天撞到了她的头,然后由于死亡的脑细胞所代表的无限少量而变得不那么聪明(仅举一个小例子):如果她的能力仍然可以被视为固定作用,几乎是固定的?
安迪

1
当然。也许是这样想的:它是固定的参数,它可能表示世界上“真正”恒定的东西,或者可能不表示例如表示实际变化的平均值。问题是:推论会产生什么固定的影响而不是其他的影响。在因果推理的情况下,问题是:假设固定效应减少的混淆比参数未捕获的小变化增加的混淆多。
conjugateprior

@安迪:一旦您开始谈论由于某些脑细胞受到创伤而改变某人的智商而导致的头部碰撞,它会在哪里停止?如果可以足够准确地进行测量,那么您在现实世界中进行的测量都不会如此固定以至于不会瞬间(无限地)变化。您只需要使用合理的判断,并在陈述结果时明确说明该判断即可。就像共轭共轭的人所说的那样,固定效应也是不同于“不变”的概念,它指的是特定的事物(参数)和您的特定目标(人口,群体等)。
韦恩

没错,关于脑细胞的例子有些牵强。我只是想更多地考虑固定效果的性质,因为大多数教科书和讲座都在这个直观方面保持沉默。当然可以提供示例,但没有一个示例可以回答我的问题。为此,我发现在这里提出这个问题非常有用,到目前为止的答案和评论都非常有用。
安迪

2

固定效果和随机效果之间的区别通常不影响估计值(编辑:至少在简单的教科书中不相关的情况下),除了效率问题外,还对测试产生了很大影响。

为了进行测试,您应该问自己的问题是,信号应超过的噪声水平是多少?即,您想对哪些人群进行概括?使用示例(1):应该是同一天,更长时期的可变性,还是不同个体的可变性?

您推断出的方差成分越多,您的科学发现就越强大,复制的机会就越大。当然,您可以要求的概括数量是有限的,因为不仅噪声变强,而且信号())变弱。为了看到这一点,可以想象是对体重的预期效果,而不是单个受试者的某些生命周期,而是所有哺乳动物的预期效果。 E c iX iE(ciE(ci)Xi


我可以按照其余的答案回答,但我对第一部分表示怀疑。固定效果允许和固定效果之间具有任意相关性,而在随机效果中,这两个必须不相关。如果不正确,则RE不一致。因此,这确实对估计有影响。X
安迪

即使随机与不相关,相对于固定的估计值,它们仍然会相对缩小。X ÇcXc
conjugateprior

@conjugateprior:确实会缩小,但组推论是基于而不是缩小的。ciE(ci)
JohnRos13年

@Andy:我看不出有理由不允许RE中的效果和噪声之间存在相关性,但是如果我们同意其余的答案,我宁愿简单地编辑我的答案。
JohnRos

2

我一直在为类似的问题而苦苦挣扎,请参阅A Festschrift(博客帖子)以了解Lord,他的悖论和Novick的预测,这是我的最佳尝试(希望我进行更正,如果我犯错了的话)。如果从等式中删除非随机冲击,则我们将简单地得到:Xitβ

yit=ci+eit

通过往回追溯,可以将其视为随机游走:

yit=ci+eityit1=ci+eit1yityit1=eiteit1

因此,这只是重新定义共轭先验答案 “只需要在研究期间保持稳定”,但我发现重新定义是有用的。因此,在研究期间,可以合理地认为,如果没有感兴趣的治疗方法部分,其结果将是随机行走,仅在随机的外源性电击的指导下进行 ' s?当然,除了琐碎的书呆子的情况之外,这不是真的Ë Xitβeit

那是我的建议结束的地方。正如gung提到George Box的短语,“所有模型都是错误的,但有些模型是有用的”。您会比我更了解如何确定何时在特定研究设计中证明这种简化是合理的。可以假设我们无法观察到,因为随机游走不能准确地表示现实-即使是一小段时间。ci

我可能会猜测您的调查示例,因为在特别短的时间内随机游走,所以测量流量类型数据(例如收入,体重)的问题可能是合理的。不过,股票类型数据(例如您今天喝了多少咖啡)似乎有点不正确的假设。


+1感谢您的链接和您的回答!我很高兴这个问题仍然引起人们的兴趣,并且可以添加更多内容。这很有见地。
安迪
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.