2016年12月

IZA DP No. 10402:缺失数据、归因和内生性

发表于:计量经济学,2017,199 (2),141-155

巴斯曼(巴斯曼,r.l., 1957,一个广义经典方法的线性估计系数的结构方程。计量经济学25,77-83;王志强,王志强,2002,结构方程中系数的广义经典估计的计算。Econometrica 27, 72-81)引入了两阶段最小二乘(2SLS)。在随后的工作中,Basmann (Basmann, r.l., F.L. Brown, W.S. Dawes和G.K. Schoepfle, 1971,在一个领先的完全可识别的情况下,结构系数的GCL估计的精确有限样本密度函数。美国统计协会杂志66,122-126)研究了它的有限样本性能。在这里,我们建立在这一传统的基础上,重点研究当内生协变量的数据在某些观察中缺失时,结构模型的2SLS估计问题。文献中已经提出了许多这样的imputation技术。然而,在现有技术中进行选择的指导很少,特别是当所估算的协变量是内生的时。此外,由于2SLS的有限样本偏差在测量精度程度上并不是单调递减的,最准确的imputation方法不一定是使2SLS偏差最小化的方法。 Instead, we explore imputation methods designed to increase the first-stage strength of the instrument(s), even if such methods entail lower imputation accuracy. We do so via simulations as well as with an application related to the medium-run effects of birth weight.