“ Stata”或“ R”中回归不连续设计中的图形


10

Lee和Lemieuxp。31,2009)建议研究人员在进行回归不连续性设计分析(RDD)时呈现图表。他们建议执行以下步骤:

“ ...对于某个带宽,以及分别对于截止值左侧和右侧的一定数量的仓和 ,想法是构造仓(, ],其中 +,其中 “ķ 0 ķ 1 b ķ b ķ + 1 ķ = 1 ķ = ķ 0 ķ 1 b ķ = Ç - ķ 0 - ķ + 1 ħ hK0K1bkbk+1k=1,...,K=K0K1bk=c(K0k+1)h.

c=cutoff point or threshold value of assignment variable
h=bandwidth or window width.

...然后比较临界点左右两侧的平均结果...”

..在所有情况下,我们还显示了截止点两侧分别估算的四次回归模型的拟合值...(同一页的第34页)

我的问题是,我们如何在编写该程序StataR密谋结果变量的图表对赋值的变量(置信区间)的急剧RDD ..一个样品例如在Stata提到这里这里(更换rd_obs RD)和样本在例子R在这里。但是,我认为这两个步骤均未执行第1步。请注意,它们都具有原始数据以及图中的拟合线。

没有置信度变量的样本图[Lee and Lemieux,2009] 在此处输入图片说明 预先谢谢。


回应您的问题,复活您的问题的一个好方法是对其进行编辑并提供悬赏:这将使您的问题更加丰富,并使更多的人对此感兴趣。如果您认为在Stack Overflow上可以更好地解决此问题,请告诉我们,我们可以为您迁移它。
chl

我希望将其迁移到Stack Overflow。
公制

1
不幸的是,这个问题太旧了,无法迁移到Stack Overflow。我相信它属于Cross Validated,但是如果您想问一下Stack Overflow(着重于编程方面并提供一个最小的可重现示例),请告诉我,我将在这里关闭。
chl

您应该使用cmogram。它可以满足您的所有需求。
Yan Song

Answers:


10

Ki

use votex // the election-spending data that comes with rd

tw 
(scatter lne d, mcolor(gs10) msize(tiny)) 
(lpolyci lne d if d<0, bw(0.05) deg(2) n(100) fcolor(none)) 
(lpolyci lne d if d>=0, bw(0.05) deg(2) n(100) fcolor(none)), xline(0)  legend(off)

twowayxsseulll

lpoly lne d if d<0, bw(0.05) deg(2) n(100) gen(x0 s0) ci se(se0)
lpoly lne d if d>=0, bw(0.05) deg(2) n(100) gen(x1 s1) ci se(se1)

/* Get the 95% CIs */
forvalues v=0/1 {
    gen ul`v' = s`v' + 1.95*se`v' 
    gen ll`v' = s`v' - 1.95*se`v' 
};

tw 
(line ul0 ll0 s0 x0, lcolor(blue blue blue) lpattern(dash dash solid)) 
(line ul1 ll1 s1 x1, lcolor(red red red) lpattern(dash dash solid)), legend(off)  

如您所见,第一个绘图中的线与第二个绘图中的线相同。


@Dimitry:为解决方案+1。但是,我想获得每个bin的平均值(请运行上面的stata示例),而不是显示原始值的散点图。CI很棒。
Metrics

1
我不太确定你的意思。我添加了代码,显示如何手动获取每个bin中的平滑均值。如果这不是您想要的,请更详细地说明您的想法。据我所知,这些图通常显示原始数据和平滑的均值。
Dimitriy V. Masterov

引用Lee和Lemieux的话(2009年第31页):“绘制数据图形的标准方法是将赋值变量(此处为d)划分为多个bin,确保截止的每一侧都有两个单独的bin点(以避免将已处理和未处理的观测值混合在同一容器中)。然后,可以为每个容器计算结果变量的平均值,并针对容器的中点绘制图形。因此,如果有50个仓位,那么我们左右将只有25个数据点,而不是全部原始数据(例如,参考数据的图表6(b):正在更新中)
指标

1
现在很清楚!我同意内核。但是您确定现在不是0度吗?那将相当于平均加权的平均平滑。
Dimitriy V. Masterov

1
我相信这对应于具有规则内核和0度多项式的
lpoly

7

这是一个固定的算法。Calonico,Cattaneo和Titiunik最近提出了一种健壮的带宽选择程序。他们为Stata和R实施了理论工作,并且还附带了plot命令。这是R中的示例:

# install.packages("rdrobust")
library(rdrobust)
set.seed(26950) # from random.org
x<-runif(1000,-1,1)
y<-5+3*x+2*(x>=0)+rnorm(1000)
rdplot(y,x)

这将为您提供此图: 在此处输入图片说明


嗨,如何添加CI?
Krantz
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.