2020年3月

IZA DP No. 13029:用于启动性能预测的公开的、文本的和非文本的信息的值

发表于:《商业风险分析杂志》,2020年第14期,e00179

公开的、从网上收集的数据可以用来在早期阶段识别有前途的创业公司吗?为了回答这个问题,我们使用这些关于丹麦公司名称及其地址的文本和非文本信息,以及它们的商业目的报表(BPSs),加上核心会计信息以及创始人和初始初创企业的特征,来预测新初创企业在五年时间范围内的业绩。我们考虑的绩效结果是非自愿退出,aboveâ欧元的平均就业增长,超过20%的资产回报率,新的专利申请和参与创新补贴计划。我们的第一个关键发现是,我们的模型预测创业公司业绩的准确性要么很高,要么非常高,除了资产回报率高,但预测能力仍然很差。我们的第二个关键发现是,预测如此精确的性能结果所需的数据很低。为了很好地预测这两种与创新相关的绩效结果,我们只需要包括一组来自英司核算体系文本的变量,而对初创企业生存和高就业增长的准确预测需要(i)来自初创企业名称的信息,(ii)与创始人相关的基本特征的数据;(iii)描述初创公司初始特征的变量(预测初创公司生存)或业务目标陈述信息(预测高就业增长)。这些变量很容易获得,因为在商业登记时必须报告基本信息。我们对生存、就业增长、新专利和参与创新补贴计划的预测的实质性准确性表明,算法评分模型有足够的空间作为资金和创新支持决策的额外支柱。

关键字

凝胶代码