2007年11月

IZA DP第3177号:用一个问题收集的收入数据有多可靠?

修订版本发表在:皇家统计学会杂志,A系列(社会统计),2010,173 (2),409-430

收入是社会科学中众多现象的重要关联因素。但许多调查仅通过一个问题收集数据,涵盖所有形式的收入。这就提出了质量问题,当人们被问及家庭总数而不仅仅是个人收入时,这些问题就更加突出了。数据通常是带状的,这意味着信息的丢失。我们以国家统计局综合调查和英国社会态度(BSA)调查为例,调查了“单一问题”数据的可靠性。我们首先比较了这些调查中的收入分布——综合调查中的个人收入和BSA调查中的家庭收入——与另外两个更大的英国调查中的收入分布,后者更详细地衡量了收入。其次,我们调查了将单个问题限制为个人收入,并且每个家庭只采访一个成年人的影响:未观察到受访者家庭的总收入。因此,我们在一项比较调查中考察了个人收入和家庭收入之间的关系。第三,在对比较国调查数据施加频带后,我们用广义熵指数测量频带带来的信息损失。然后,我们评估了它对使用收入作为协变量的影响。 Disaggregation by gender proves fruitful in much of the analysis.