像COVID-19大流行这样的经济冲击可能会导致许多人开始接受政府的收入支持。有些人最终可能会在很长一段时间内依赖政府转移支付。这种对福利的依赖会使受惠者士气低落,并为政府创造大量支出。
一个新的IZA讨论文件通过达里奥桑松和安娜·朱展示了如何使用机器学习算法来预测哪些人最有可能成为长期福利受益人。高质量的大数据和机器学习方法的融合使这些研究人员能够提供比常用的基准模型更好的预测。具体来说,它们可以预测个人在随后四年中依靠收入支持的时间比例,比标准早期预警系统至少高出22%。
机器学习可以成功地应用于大型管理数据
政府越来越多地使用机器学习来解决社会问题并做出资源分配决策。例如,它已被用于帮助法官改善保释决定,学校来识别有辍学风险的学生,医生筛选病人进行髋关节置换手术.在这项研究中,作者使用了澳大利亚社会保障登记的全部人口的数据。
这些数据包括关于数百万个人及其家庭成员的收入支助接收模式的每日信息,以及其他人口和社会经济信息。数据集的规模和丰富程度使其成为机器学习应用程序的理想选择,允许算法通过检测数据中的细微模式和识别新的强大预测器来实现高性能。
作者的方法旨在补充现有的针对长期福利的早期干预项目。在政府实施这些计划之前,他们需要知道哪些人面临的风险最大——机器学习算法可以胜任这一角色。此外,这些改进的预测可能会减少人类决策过程中常见的有意识和无意识偏见.重要的是,这种方法的实现成本也相对较低,因为它利用了实践者已经可以使用的管理数据。
剩下的挑战和下一步
尽管它们越来越受欢迎,但仍然有很大程度的怀疑采用这种自动化系统的影响,因为精度问题和偏见强化。正因如此,两位作者认为,他们的算法不应取代人类的专业知识,而应作为人类专业知识的补充。例如,社会工作者可以集中他们的注意力和时间提供个性化服务,并针对算法确定的风险最大的个人提供适当的支持。
同样地,识别有风险的个体只是第一步。打算帮助合适的个人迅速离开福利系统的决策者还需要知道哪些干预措施有效,这些干预措施最有可能对谁起作用。单靠预测无法回答这些问题:理想情况下,需要从随机对照试验中获得的因果估计结合机器学习来识别感兴趣的子种群.