2003年12月

IZA DP No. 969:调查中虚假访谈的识别、特征和影响:通过SOEP原始数据中的真实虚假分析

Joerg-Peter Schraepler,格特·瓦格纳

发表于:Allgemeines statistics archives, 2005, 89 (1), 7-20

据我们所知,在为数不多的分析虚假访谈对调查结果影响的方法学研究中,大多数都是基于项目学生在“实验室环境”中产生的“人造虚假”。相比之下,面板数据提供了一个独特的机会来识别哪些数据实际上是由面试官伪造的。通过比较两波的数据,几乎所有的假货都很容易被识别出来。因此,德国社会经济小组研究(SOEP)的原始数据建立在几个子样本上,为虚假访谈提供了丰富的来源。然而,因为面试官知道小组面试者会在一段时间内再次接受面试,聪明的面试官不会假装小组面试。事实上,在SOEP的原始数据中,这一比例仅占所有记录的0.5%。这些假货用于分析未被检测到的假货对调查结果的潜在影响。主要结果是,伪造的记录对平均值和比例没有影响。但在非常罕见的例外情况下,如果无法检测到假货,则可能会对相关性和回归系数的估计产生偏差。应该注意到,除了前两波样本E中的一些虚假数据外,虚假数据从未在广泛使用的SOEP中传播。 The fakes were detected before the data were released.