三重差分法及运行 双重差分法的关键假设是实验组与对照组的时间效应一样。这个假设只有通过足够长的时间序列数据才能检验。需要指出的一点是,即使干预发生之前两组时间序列一致,也不能保证干预发生后两组时间序列是一致的。有可能在干预发生的同时在实验组或者对照组中又发生了其他影响产出的事件,则干预发生后两组的时间趋势是不一致的。简单的双重差分估计是有偏的。如图3所示,如果对照组是虚线所示,则双重差分估计是无偏的。但如果对照组是上方的实线,则双重差分估计法是有偏的,偏差部分是在时刻,该实线与虚线之间的距离。 解决这个问题有两个思路:第一个是寻找更多的对照组,把多个对照组加权构造成一个虚拟的对照组,使得虽然每个对照组都与实验组的时间趋势不一样,但加权后的虚拟对照组的时间趋势与实验组的一样。这个方法被称作综合控制法(Synthetic Control Method)。Abadie & Gardeazabal(2003)(14)用这个方法研究了恐怖冲突对经济发展的影响。 解决这个问题的第二个思路是估算出这个因为时间趋势不同而带来的偏差,然后从双重差分结果中减去这个偏差即可。这被称作三重差分法(Difference-in-differences-in-differences, DDD)。三重差分法的思路是,既然两个地区(分别指实验组和对照组)的时间趋势不一样,那么我们可以分别在两个地区寻找一个没有受到干预影响的人群/行业,通过对这两组的双重差分估算出时间趋势的差异,然后再从原来实验组和对照组的双重差分估算值中减去这个时间趋势差异。Gruber(15)就使用了这种方法。 图3 时间趋势差异造成的估计偏差 三重差分法例证: 三重差分法回归及运行命令 正如上面的二重差分法实际上运用的是OLS做的回归,我们之前说过,倍差法是相当于two-way fixed effect model,里面包括个体效应时间效应,而对于一个这样的panel data,我们可以运用LSDV通过添加个体和时间虚拟变量来回归,或者运用demeaned variables回归来消除个体和时间效应,再加上那些交互效应后就可以像其他fixed effect回归一样。二重差分法一般是在同一个省(地区)区分treatment和control组的,而三重差分法则包括另一个未受到政策冲击的省(地区),来区分treatment和control组的,当然三重差分法要稳健得多。 Empirical Methods in Applied Economics Lecture Jorn-Steffen Pischke 接下来,我们来区分一下二重差分和三重差分在Stata的运行过程 1992年,美国新泽西州通过法律将最低工资从每小时4.25美元提高到5.05美元,但在相邻的宾夕法尼亚州最低工资却保持不变。Card and Krueger收集了两个州的快餐店在实施新法前后雇佣人数的数据,并使用双重差分法进行估计。 注:fte:full time employment人数; treated=1,表示快餐店在新泽西州,否则在宾夕法尼亚州;t=1,表示时间为1992年11月, 否则为1992年2月;bk=1,表示Burger King快餐品牌;kfc=1,表示肯德基快餐品牌;roys=1,表示Roy Rogers快餐品牌; wendys=1,表示Wendy's快餐品牌。 以下黑色字体的code可以直接在Stata上执行 1.读取数据: userepec/bocode/c/CardKrueger1994.dta" 2. 简单的二重差分: diff fte, t(treated) p(t) *这里DD10%水平下显著 3.简单的三重差分(快餐品牌bk作为第二个处理组): diff fte, t(treated) p(t) ddd(bk) *这里DDD表不显著 本文来源:https://www.wddqw.com/doc/c5543212edfdc8d376eeaeaad1f34693daef10c9.html