Questions tagged «regression»

在统计中,回归分析是用于估计变量之间关系的统计过程。当关注于因变量和一个或多个自变量(或“预测变量”)之间的关系时,它包括许多用于建模和分析多个变量的技术。

5
如果“控制变量”也是内生的,会发生什么?
我从事政治经济学工作,许多模型都包含“无辜的”控制变量,例如人口,不平等,殖民地遗产等,因此作者可以声称自己的独立利益变量没有偏见。 但是,如果这些控制变量中的任何一个是某些省略变量的内生因素,这是否会污染所有自变量的无偏性? 如果是这样,那我们该怎么办?忽略那些控制变量,它们自身会导致省略变量偏差。将它们包括在内,它们将污染模型中的所有内容。 示例:研究人员想知道不平等是否会导致暴力,他控制了一些事情: 看到不平等很可能是内生的(由于省略了利他主义的变量变量(Level of altruism),他将尝试为不等式找到工具变量。但是,成长和发展是否也可能是内生的(即与利他主义水平相关)?Violence=Inequality+Growth+Development+ϵViolence=Inequality+Growth+Development+ϵ\begin{equation} Violence = Inequality + Growth + Development + \epsilon \end{equation} 这个例子可能看起来很愚蠢,但是我的观点是在政治经济学/发展工作中,有太多因素在起作用(但仍被省略),我恐怕LHS中包含的许多变量都是内生的。然而,研究人员通常只为自己的宠物自变量寻找一种工具。

2
总体人口回归
当包括所有总体时,回归中系数的标准误的含义是什么? 这个问题让我很困惑。因为在我看来,包括整个总体时,标准错误没有意义-无需统计推断,因为您已经拥有了整个总体。 但是,即使在顶级期刊上发表的许多文章也是如此广泛地使用了它。例如,如果我正在研究一个国家的GDP增长率与其人口密度之间的关系,则可以进行回归分析: GDPi=α+βPopi+γXi+ϵiGDPi=α+βPopi+γXi+ϵi GDP_i = \alpha + \beta Pop_i + \gamma \mathbf{X}_i + \epsilon_i 与地球上所有195个国家/地区合作。在这种情况下,所有国家(人口)都包括在内。但是所有文献仍在讨论系数的统计意义。 有人可以解释整个人口回归时是否滥用统计推断?

1
推导OLS系数的另一种方法
在我的另一个问题中,回答者使用以下OLS系数推导: 我们有一个模型:其中未被观察到。然后我们有:其中和。Y=X1β+X2β2+Zγ+ε,Y=X1β+X2β2+Zγ+ε, Y = X_1 \beta + X_2 \beta_2 + Z \gamma + \varepsilon, ZZZplimβ^1=β1+γCov(X∗1,Z)Var(X∗1)=β1,plimβ^1=β1+γCov(X1∗,Z)Var(X1∗)=β1,\text{plim}\, \hat \beta_{1} = \beta_1 + \gamma \frac{Cov(X_1^*, Z)}{Var(X_1^*)} = \beta_1, X∗1=M2X1X1∗=M2X1X_1^* = M_2 X_1M2=[I−X2(X′2X2)−1X′2]M2=[I−X2(X2′X2)−1X2′]M_2 = [I - X_2(X_2'X_2)^{-1}X_2'] 这看起来与我在计量经济学中看到的通常的有所不同。关于此推导是否有更明确的说明?矩阵有名称吗?β=(X′X)−1X′Yβ=(X′X)−1X′Y\beta = (X'X)^{-1}X'YM2M2M_2

2
估计需求的价格弹性
我有25个季度观察,我想估计需求的价格弹性。我打算使用GMM-IV估算器。但是,我读到它对小样品不好。你有什么建议我的?请记住,我不是专业的计量经济学家。

0
部分R2和回归量的贡献
我在Cross Validated上问了一个类似的问题,但没有得到答案。以下问题完全不同。 考虑以下确定性关系:ÿŤ= C.Ť+ 我Ť+ G.Ť+ (XŤ- M.Ť)Yt=Ct+It+Gt+(Xt−Mt)Y_{t}=C_{t}+I_{t}+G_{t}+(X_{t}-M_{t}) 如果我们对协变量运行的Y的OLS回归,当然,我们得到了一个 的1,和系数等于其人口同行的载体,即β = β = 1[R2R2R^{2}β^=β=1β^=β=1\hat{\beta}= \beta=1 现在,这意味着每个回归量的边际效应是不变的。但是,每个回归量的贡献取决于它与y的相对方差。事实上,在单变量情况下,可以示出: 表明即使x 对y的边际效应 很大,它在部分R2 意义上的贡献只有在它变化很大时才会很高,导致y也随之变化。R2=β2var(x)var(y)R2=β2var(x)var(y)R^{2}=\beta^{2}\frac{var(x)}{var(y)}xxxyyyR2R2R^{2} 现在,考虑相同的上述表达式:Yt=Ct+It+Gt+(Xt−Mt)Yt=Ct+It+Gt+(Xt−Mt)Y_{t}=C_{t}+I_{t}+G_{t}+(X_{t}-M_{t}) 对于整个系数向量和设计矩阵,让我们将除以Y t。YtYtY_{t} 我们得到:1=CtYt+ItYt+GtYt+(Xt−Mt)Yt1=CtYt+ItYt+GtYt+(Xt−Mt)Yt1=\frac{C_{t}}{Y_{t}}+\frac{I_{t}}{Y_{t}}+\frac{G_{t}}{Y_{t}}+\frac{(X_{t}-M_{t})}{Y_{t}} YtYtY_{t} 现在我们对每个观察的每个回归量都有相对贡献,我们可以得到回归量在观察中的平均贡献。 R2R2R^{2}

2
子样本上的OLS参数何时不变?
存在观察的样本,每个元素具有数字和特征。样本是残差向量的OLS回归 。假设我们从样本中删除观察,将其限制为观察,并再次运行OLS回归,产生 下标表示和与以前不是相同的向量,因为缺少观察。nnnYYYXXXY=b0+b1X+u,Y=b0+b1X+u, Y = b_0 + b_1 X + \textbf{u}, uu\textbf{u}iiin−1n−1n-1Y−i=b′0+b′1X−i+u′.Y−i=b0′+b1′X−i+u′. Y_{-i} = b_0' + b_1' X_{-i} + \textbf{u}'. −i−i_{-i}YYYXXXiii 在我看来,如果关注我们删除是对原样品的“回归线”,即如果 然后和。iiiYi=b0+b1Xi,Yi=b0+b1Xi, Y_i = b_0 + b_1 X_i, b0=b′0b0=b0′b_0 = b_0'b1=b′1b1=b1′b_1 = b_1' 示例:(在R代码中) x = c(5,3,4,5,4,4) y = c(20,15,14,21,10,25) plot(x,y) abline(coef(reg)) plot(x[-1],y[-1]) reg1 = lm(y[-1] ~ x[-1]) abline(coef(reg1)) …

3
暂时性冲击与永久性冲击有什么区别?
在我的计量经济学中的时间序列回归模型研究中,我们讨论了基本的时间序列回归并解释了有限分布滞后模型中冲击的影响。我想知道,从直觉上来说,暂时性冲击与永久性冲击之间有什么区别。根据我目前的理解,每一次冲击都是永久的,因为您无法撤消过去。难道不是说一种效果是短暂的,就像完全从存在中消除了它的效果而从不考虑它一样吗?我认为我错了,但我不知道为什么。

2
条件独立,没有相关性
我有一个关于基本计量经济学的问题。 考虑一下模型 $$ y_i = \ alpha + \ beta x_i + u_i $$ 我理解线性回归模型的假设4表明 $$ [1] \ quad E(u | x)= 0 $$ 但是,我经常看到这种情况写成: $$ [2] \ quad E(ux)= 0 $$ 这两件事情是否相同?我看到如果[1]和$ E(u)= 0 $那么我们得到[2];但是我不明白为什么[2]会暗示[1]。

0
添加回归量如何影响标准误差和现有系数?
(首先,如果你能更清楚地写出我的问题标题,奖励积分) 我现在的项目是研究公民身份和收入。 起初我的回归是这样的: $$ INCOME = \ beta0 + \ beta1STATUS $$ 现在,我将使用这样的控制变量做一个: $$ INCOME = \ beta0 + \ beta1STATUS + \ beta2EDUCATION + \ beta3ZIPCODE $$ 当我查看移民身份的系数和标准误差时,移民身份和所有控制变量的收益回归告诉我与移民身份收益的回归情况相比如何?通常在回归中,添加更多变量如何更改标准误差和系数?

0
在线性回归中,A / B能比单独的A,B更好吗?
在学习计量经济学时,我很想知道是否 A/B 可以做出比分离更好的变量 A 和 B,构建线性回归模型时。 变量通常在线性回归中更改为更合适的形式,例如将其设为log(x)或更改其比例以获得更好的解释。所以我想,为什么不尝试采用两个变量的比例并摆脱原来的两个? (当然要避免多重共线性。) 举个例子,假设我对股票价格感兴趣并对其进行线性回归。包括原件会更好吗? book value 和 market value 作为我的模型中的两个独立变量或将它们变成一个变量 book value/market value?还是取决于情况/目的?

2
每月平均折扣率,3个月国库券,Sterling Vs 1个月
在计算股票的预期回报时,我的一位教授建议我使用英国国库券以获得无风险利率。 我想知道我是否应该使用1个月的T-Bills或3个月的T-bills。 哪个更好用,为什么? 我的讲师提到我下载的无风险费率将是年度百分比数字(虽然可能有也可能没有%符号),所以我需要将它们转换为每日费率才能在回归中使用它们。有谁知道我在哪里可以获得这些数据?我在英格兰银行网站上找到了1个月和3个月的T-bills数据。我需要知道如何获取这些T-bills的每日数据。

0
用于评估解释变量贡献的联盟游戏和Shapley值
我有一个问题,乍一看似乎不是联盟游戏,而是可以描述为具有所有二分变量的逻辑回归:1响应变量Y(我稍后称之为特征/紫星)和5个解释变量A ,B,C,D和E(也是二进制)。 我试图推断出哪些解释变量对Y的贡献最大,并且最好以某种方式定量评估它们的严重程度(比如排序预测变量,变量选择等),并且我发现与Shapley值有很大的相似性。 它与联盟游戏非常相似,因为它具有强大的合作性,但我不确定我是否可以在这种特殊情况下使用它。这种方法的主要问题在最底部用粗体表示。 您能否看看下面的情况,并推荐一些方法,如何使用Shapley值来推断哪种解释以及在多大程度上对响应Y(特征/紫星)的贡献最大。 比方说,我们有五个不同的对象表示为标记的球:A,B,C,D,E创建一些子集和感兴趣的单个特殊特征标记为紫色星。如果星形被填充,则该特征存在于特定集合中,而空心星形表示其不存在。 25−125−12^5 - 12323\frac{2}{3} 我们可以假设(如果需要的话)总是存在至少一个具有该特征的全集实例(例如,标有较厚红包的实例)。 25−125−12^5 - 1 FACEFACEF_{ACE} NACENACEN_{ACE} TACE=FACE+NACETACE=FACE+NACET_{ACE} = F_{ACE} + N_{ACE} TXTXT_XXXXX⊂YX⊂YX \subset YTX≥TYTX≥TYT_X \geq T_Y(A,C,E)⊂(A,B,C,D,E)(A,C,E)⊂(A,B,C,D,E)(A, C, E) \subset (A, B, C, D, E)TACE≥TABCDETACE≥TABCDET_{ACE} \geq T_{ABCDE}。这是因为子集(A,B,C,D,E)的任何实例同时是(A,C,E)的实例,但对于较窄的(A,C,E),我们可以有更多实例。 在本说明书中,我为每个子集类型使用六个实例,因为图片的空间有限,而这六个实例旨在反映具有和缺少该特征的实例之间的总体比例。 25−125−12^5 - 1 FACETACE=56, FBDTBD=16, FABCDETABCDE=46 (the situation of the very first picture)FACETACE=56, FBDTBD=16, …

1
对协整向量的三角约束的替代归一化
Johansen建议为了进行推理,必须对协整向量进行规范化。所有软件包都使用协整矢量的三角归一化,即,估计的β矩阵的顶部到r块是单位矩阵。通常,这是通过推导估计的长期方程(协整方程矩阵)的行梯形形式来实现的。[Rrrrrrββ\beta 有人知道其他归一化形式吗?或制定不同归一化方法?谢谢

0
具有二元因变量的非平衡动态面板模型中的Nickell偏差
在现有文献中,我似乎无法从树上告诉森林。 想象一下,我想测试动态面板设置中的外部冲击对获得脉冲响应函数的影响,如下所示: $ y_ {it} = \ beta_0 + \ gamma(L)y_ {it} + \ rho(L)x_it + \ alpha_i + \ sigma_t + \ epsilon_ {it} $ 其中$ \ gamma(L)$和$ \ rho(L)$是不同长度的滞后运算符。 $ x_ {it} $是外部冲击,$ \ alpha_i $和$ \ sigma_t $分别是国家和时间假人。 $ \ epsilon_ {it} $是错误术语。重要的是,外源性休克仅仅是固定效应的外生条件。观察单位是国家年。 现在想象一下,样本是不平衡的,一些国家的T值小到3,而有些国家则有62.因此,样本应该遭受严重的尼克尔偏差,对吧? 我的问题是:如果我的面板不平衡或者我仍然可以使用ML和GMM进行一些偏差校正,它会改变什么吗?如果是这样,我应该使用哪些更正? 现在假设,我的因变量本质上是二进制的。由于我使用固定效果,我必须对ML情况应用logit回归,不是吗?是否有可用于估算偏见的估算器? 现在假设我想测试外源性冲击影响我感兴趣的变量的通道。我会通过互动术语做到这一点,对吗?如果是这种情况,我将使用哪个估算器来获得无偏见的结果?

1
与一个负面成分的正相互作用项?
假设我有一个增长的增长回归,其中我的Y是GDP增长,而我的X是经典的MRW变量,+国际援助+腐败+两者之间的交互术语。 基本上,我有兴趣看到低腐败是否会提高国际援助的有效性,这意味着我希望看到我的互动条款有一个积极的迹象。 但是,我也认为我应该看到腐败的负面迹象,因为腐败越高,增长就越低。 现在,我的问题: 这是可能的,因为我描述它?我可以看到负面成分但是积极的互动术语吗?在哪种情况下,我应该如何解释它? 或者是否有理由认为腐败系数应该是积极的,并且仍然表明更高的“制度质量”本身对增长产生积极影响,并且与援助相互作用?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.