在因果推断的研究中,工具变量(IV)回归无疑是经济学者手中的核心利器之一。然而在现实研究中,研究者常常面临“弱工具变量”与“模型设定偏误”两类难题,这使得传统推断结果的可信度大打折扣。威斯康星大学麦迪逊分校史晓霞教授,在经济与社会研究院(IESR)“暨南论道”第75期线上公开学术讲座中,分享了针对工具变量弱识别与模型误设同时存在时的一套“双重稳健”的全新检验方法。
史晓霞教授
传统的工具变量回归往往假设模型设定正确,以及工具变量相关性足够强为前提。但在现实研究中,遗漏变量、非线性关系或异质性处理效应让真实的结构参数变得难以被精确识别。现有的计量方法通常只能在“弱IV稳健”或“模型偏误稳健”检验中二选一,一旦两者并存,现有推断方法就会产生严重的偏差。面对这种困局,模型对应的“伪真值(Pesudo True Value)”要么根本不存在,要么不唯一、且缺乏经济学解。这正是此项研究工作的出发点。
史教授的研究的创新在于把“检验意义下的伪真值(Pseudo True Value of a test)”的概念引入弱工具变量稳健推断的框架。她指出,即便模型设定存在偏误,甚至工具变量本身存在弱相关,二阶段最小二乘法(2SLS-t)检验所瞄准的目标量所收敛到的“伪真值”检验依然对政策评估具有现实的参考含义。更重要的是,相比于其他统计量,2SLS-t检验具有唯一合适的伪真值,这使其与Aderson-Rubin(AR), Lagrange Mutiplier (LM), Likelihood-Ratio(LR)检验方法相比,成为了一个更稳健、更理想的推断检验方法。
为了对这一伪真值实现稳健,精准的推断,史教授在讲座中提出了两套互补方法。首先是基于Delta方法的t检验,工具变量数量增大时,通过对统计量进行偏差校正与方差调整,有效解决了传统检验在弱IV下的分布失效问题,使其即便在工具变量弱相关环境下也能渐进服从正态分布。更进一层的方案则是“双重条件检验”,它通过工具变量强度和模型偏误程度这两个核心指标进行条件化处理,从而在小样本或弱相关环境下仍能良好控制检验水平,确保研究结论不被虚假的显著性所误导。这一框架同样能够适应异方差、聚类相关与序列相关等复杂的现实数据特征。在大规模蒙特卡洛模拟中,新方法在绝大多数参数区域的表现均优于现有主流的弱 IV 稳健检验。
史教授给出的实操建议是:在线性工具变量模型中,当工具变量数目较多时,优先采用基于delta方法的t检验,当工具变量数目较少时采用精炼双重条件检验,以兼顾水平控制与功效。这场讲座为应用经济学家在面对弱识别与模型误设并存的现实困境时,提供了一套理论与操作层面都更稳健的工具。讲座最后的问答环节,与会师生围绕方法在非线性 IV 与面板 IV 设定下的可推广性等问题与史教授展开了深入交流。