2019年1月

IZA DP No. 12081:套袋:Stata中的正则化回归模型选择和预测

本文介绍了lasassopack,这是Stata中用于正则化回归的一套程序。lasassopack实现套索,平方根套索,弹性网,岭回归,自适应套索和后估计OLS。这些方法适用于高维设置,其中预测因子p的数量可能很大,并且可能大于观察数n。我们提供了三种不同的方法来选择惩罚(“调优”)参数:信息标准(在lasso2中实现),截面、面板和时间序列数据的K-fold交叉验证和提前h步滚动交叉验证(cvlasso),以及截面和面板数据的套索和平方根套索的理论驱动('严格')惩罚(rlasso)。我们将讨论每种方法的理论框架和实际考虑。我们也提出蒙特卡洛结果比较性能的惩罚方法。