2021年3月

IZA DP No. 14221:使用机器学习和定性访谈设计五个问题的女性代理指数

Seema Jayachandran, Monica Biradavolu, Jan Cooper

我们提出了一种新的方法来设计一个简短的调查措施的复杂概念,如妇女机构。该方法结合了混合方法数据收集和机器学习。我们根据这些问题与定性访谈中得出的概念的“黄金标准”测量的相关性强弱来选择最佳调查问题。在我们的应用程序中,我们首先通过半结构化面试来测量印度哈里亚纳邦的209名女性的代理,其次通过大量封闭式问题来测量。我们使用定性编码方法对每位女性的代理机构进行评分,我们将其视为她的真实代理机构。为了确定最能预测“真相”的封闭式问题,我们应用了基于LASSO和随机森林的统计算法,但限制了为模型选择的变量数量(在我们的例子中是五个)。由此产生的5个问题指数与编码的定性面试紧密相关,就像使用所有候选问题的指数一样。这种根据与编码定性访谈的统计对应关系选择调查问题的方法,可以用于为许多其他潜在结构设计简短的调查模块。