PLUS会员

bqbppxmo_作业

由bqbppxmo创建,最终由bqbppxmo 被浏览 10 用户

使用总市值,换手率,pe_ttim和净利润(单季度, 同比增长)的截面排序 4个因子作为因子,使用LinearRegression,xgboost和随机森林分别进行回归,LinearRegression效果最好,如下图所示。


思考:

因子更重要还是模型更重要?

因子和模型都重要

  • 因子是基础:决定模型能达到的 “上限”,没有优质因子,模型再强也无用。
  • 模型是工具:决定能否接近这个 “上限”,合适的模型能更好地利用因子中的信息。

这次选的四个因子作用最大的市值和换手,去掉这两个因子可以看到收益明显下降,不同的模型收益也不一样,这个需要多次尝试。


相同因子下不同模型的区别?

  1. 训练耗时不同,LinearRegression训练耗时短,xgboost和随机森林耗时长。
  2. 需要调的参数不同,就算同一个模型使用不同的参数可能,这次没有进行参数调优,只试了将xgboost和随机森林的n_estimators改为20节约训练时间
  3. 可解释性不同。


代码:

https://bigquant.com/codesharev3/540e5605-7da4-4c3c-91f4-f8061c297938


\

{link}