劳动经济研究所:基于正则化回归的模型选择与预测

2019年1月

IZA DP No. 12081:套袋:Stata中的正则化回归模型选择和预测

本文介绍了lasassopack，这是Stata中用于正则化回归的一套程序。lasassopack实现套索，平方根套索，弹性网，岭回归，自适应套索和后估计OLS。这些方法适用于高维设置，其中预测因子p的数量可能很大，并且可能大于观察数n。我们提供了三种不同的方法来选择惩罚(“调优”)参数:信息标准(在lasso2中实现)，截面、面板和时间序列数据的K-fold交叉验证和提前h步滚动交叉验证(cvlasso)，以及截面和面板数据的套索和平方根套索的理论驱动('严格')惩罚(rlasso)。我们将讨论每种方法的理论框架和实际考虑。我们也提出蒙特卡洛结果比较性能的惩罚方法。

下载

关键字

成套索
弹性网
套索
rlasso
cvlasso
lasso2
交叉验证

IZA DP No. 12081:套袋:Stata中的正则化回归模型选择和预测

关键字

凝胶代码