5月26日中午12点,经济与社会研究院“实证研究阅读小组”第六次论文阅读活动在中惠楼106举行。研究院及经济学院20余名师生参与了此次阅读分享。在本次活动中,研究院副教授苏应俊基于Freyaldenhoven等人的论文“Visualization, Identification, and Estimation in the Linear Panel Event-Study Design”进行了分享。
苏应俊
苏应俊首先介绍了几种对事件研究法可视化图表(Event-study Plot)进行优化的建议。首先,假定被解释变量在t期的值最多只受t+G期内以及t-M期的政策变量影响,则将-G-1期的估计系数标准化为0,这有助于读者通过各期估计系数的置信区间了解其统计显著性。当G取值为0时,这种做法相当于将政策时点前一期的系数标准化为0。
第二,在y轴添加标签,标明被解释变量在被标准化时点-G-1期的均值,这有助于读者评估政策效应的经济显著性。当G取值为0时,这种做法相当于标明被解释变量政策时点前一期的均值。
第三,在原有标明逐个时点估计系数的置信区间(95 Percent Pointwise Confidence Interval)的图形基础上,增加一个新的置信带(95 Percent Uniform Confidence Band),来帮助读者了解整个事件时间路径(Event-time Path)的显著性。
第四,对政策时点G期前与政策执行M期后的政策效应分别进行Wald检验,并将P值展示在图中,这有助于判断是否存在事前趋势(Pre-trend)与政策效应是否在M期后趋向稳定(Level-off)。
第五,某些不可识别的混杂因素(Confound)可能影响估计结果。为了帮助读者判断估计结果完全由混杂因素导致的可能性,可以画出“波动最小”(Least Wiggly)的表示混杂因素的多项式的图形。
第六,为总结政策效果的大小,研究者往往还选择估计限制性更强的模型(例如静态模型)。在这种情况下,建议将该限制性更强的模型的累积效应绘制在原有的事件研究法可视化图表上,用来评估该限制性更强的模型对包含动态效应的更灵活模型的拟合度。
上述图形绘制方法都可通过Stata命令xtevent实现。接着,苏应俊介绍了在对混杂因素做出一定假设的情况下识别政策效应的几种方法。首先,在不可观测变量符合一定结构时,可以在没有代理变量或工具变量的情况下进行识别。这又包含两种情形:(1)若混杂因素可以表示为某一已知的关于时间t的低维函数f(t),可将个体变量(Unit Indicators)与f(t)交乘,通过双向固定效应模型进行估计;若 f(t)未知但是可以从数据中推断,则可以通过交互固定效应(Interactive Fixed Effects)、共同相关效应(Common Correlated Effects)、合成控制法(Synthetic Control)等方法估计。(2)当混杂因素满足某一特定函数形式(具体参见Freyaldenhoven et al.,2021))时,可以通过被解释变量在政策时点前的趋势推断其变化趋势。将这一变化趋势外推至政策时点后,就可以近似地了解混杂因素在政策时点后的影响,并对估计结果做出相应的调整。
而当我们有混杂因素的代理变量或工具变量时,识别方法会有所不同。当有两个代理变量且两个变量的测量误差不相关时,可以将其中一个变量作为另一变量的工具变量,使用两阶段最小二乘法估计;当只有一个代理变量且其测量误差与政策无关时,并且该代理变量显示出事前趋势(pre-trend), 可以选择未来期的政策变量作为该代理变量的工具变量;当存在混杂因素的工具变量时,可以使用该工具变量进行两阶段最小二乘估计。
参考文献:
Freyaldenhoven, S., Hansen, C., Pérez, J.P. and Shapiro, J.M., 2021. Visualization, Identification, and Estimation in the Linear Panel Event-Study Design (No. w29170). National Bureau of Economic Research.