2018年9月24日

新报告:大数据的挑战:经济学家需要掌握新的技能,以充分利用可用的大量数据集

由于连接数字设备的普及,观测数据集现在比传统调查大得多,频率也更高。一个新的IZA世界劳工报告研究人员需要新的训练和思考才能从这种规模的数据集中学习。

对于雄心勃勃的经济学家、政策制定者或社会科学家来说,大数据的兴起是一个令人兴奋的时代。以前从未有过如此多的数据可以用来检验现有的理论并提出新的理论。经济学家在这方面有天然优势,因为他们习惯于处理复杂的数据。然而,这种优势正在迅速下降。在小型数据集中,传统计量经济学方法往往优于更复杂的技术,而在大型数据集中,机器学习方法表现抢眼。因此,根据加州大学经济学家马修·哈丁和查普曼大学经济学家乔纳森·赫什的观点,需要新的分析方法来充分利用经济学中的大数据。

大数据的挑战之一是必须管理包含许多甚至数千个变量的更大数据集。如果事先没有对基础数据生成过程的清晰理解来指导自己的工作,时间可能会被低效地浪费在搜索选项上。

此外,在模型拟合过程中,机器学习方法的参数经常需要校准或调优。要做到这一点,经济学家需要了解这些过程。根据哈丁和赫什的说法,使用大数据或机器学习并不意味着经济学家需要从一个完全不同的角度进行分析。通常情况下,机器学习工具只是增强了现有的计量经济学方法。

哈丁和赫什在2017年最近的一项研究中举了一个机器学习技术的例子。其目的是建立一个结构性的粮食需求模型,并模拟美国不同产品和营养税的影响。现有食品交易数据(条形码)的丰富性意味着可以观察到110多万种不同食品的食品购买情况,这是用传统经济学方法无法分析的一组数据。这就是机器学习可以提供帮助的地方,它可以提供一种更强大的方法,使用一种算法,根据产品的详细营养成分(例如卡路里、脂肪和糖)将产品聚类为不同的组。但即使是这个简单的算法也需要进行研究的经济学家进行微调。

哈丁和赫什的结论是:来自机器学习的新方法正在扩展大规模处理大数据的能力,如果不将这些方法纳入他们的工具包,研究人员就有可能被切断与前沿领域的联系。经济学家知道如何构建和检验因果陈述,这使得他们的技能在一个数据饱和的世界中非常有价值。挑战在于学习如何大规模实施这些方法。”

如果您参考或引用该报告,请注明IZA劳动世界。

有关数字化和大数据的进一步研究请访问IZA劳动世界关键主题页。

媒体联络:
请联系安娜·冯·哈恩了解更多信息或进行作者采访:anna@smallspaceagency.com或+44 7852 882 770

编辑注意事项:
IZA劳动世界(http://wol.iza.org)是一个全球性的免费在线资源,为政策制定者、学者、记者和研究人员提供关于全球劳动经济学问题的清晰、简明和基于证据的知识。

该网站提供了相关和简洁的信息,主题包括多样性、移民、最低工资、青年失业、就业保护、发展、教育、性别平衡、劳动力流动性和灵活性等。

劳动经济研究所(www.ecmna114.com)是一家独立的经济研究机构,专注于分析全球劳动力市场。它的总部设在波恩,运营着一个由超过45个国家的约1500名经济学家和研究人员组成的国际网络。

PDF版本