2020年3月

IZA DP No. 13029:启动性能预测的公开可用、文本和非文本信息的价值

发表于:《商业风险观察杂志》,2020年,14,e00179

公开的、从网络上获取的数据能被用来在早期阶段识别出有前途的创业公司吗?为了回答这个问题,我们使用了关于丹麦公司名称及其地址的文本和非文本信息,以及他们的商业目的声明(BPSs),辅以核心会计信息以及创始人和初始启动特征,来预测新启动企业在五年时间范围内的表现。我们考虑的绩效结果包括非自愿退出、平均就业增长、20%以上的资产回报率、新的专利申请和参与创新补贴计划。我们的第一个关键发现是,我们的模型对初创公司业绩的预测准确率很高或非常高,只有资产回报率高的情况例外,但预测能力仍然很差。我们的第二个关键发现是,预测如此准确的绩效结果所需的数据很低。为了很好地预测这两个与创新相关的绩效结果,我们只需要包括一组来自BPS文本的变量,而准确预测创业公司的生存和高就业增长需要结合(i)来自创业公司名称的信息,(ii)与创始人相关的基本特征的数据;(iii)描述创业公司初始特征的变量(预测创业公司的生存)或商业目的声明信息(预测高就业增长)。这些变量集很容易获得,因为在商业注册时必须报告基本信息。我们对生存、就业增长、新专利和参与创新补贴计划的预测具有很高的准确性,这表明算法评分模型有足够的空间作为资金和创新支持决策的额外支柱。

关键字

凝胶代码