2023年2月

IZA DP No. 15941:关于使用网页文本识别调查目标人群的有效性:检测在线平台的应用

按实际使用量付费饶舌的人,沃尔特Hassink,巴特·克利斯

开发了一个统计分类模型,以根据其网站上的文本识别在线平台组织。该模型随后被用于识别所有(潜在的)平台组织,其网站包括在荷兰商业登记册中。统计模型的实证结果在词语和拟合概率的双峰分布方面是合理的,但结果表明高估了平台组织的数量。接下来,通过在统计分类模型确定为平台组织的组织下进行的调查来调查结果的外部有效性。各组织对调查的答复证实了大量的第一类错误。此外,它还揭示了基于文本的分类模型的拟合概率与组织对在线平台组织调查问题的响应之间的正相关。调查结果表明,基于文本的分类模型可以用于从拥有网站的整个企业群体中获得潜在平台组织的子群体。