如何选择与优化因子权重?
由iquant创建,最终由iquant 被浏览 53 用户
问题
我想请教大神们有关因子优化问题:
在labeler做标签训练以后会产生权重,那么这些权重是什么意思?
这些权重是指神经网络里面的权重,还是指多元回归中的权重,还是随机森林里面的gini系统还是信息增益呢?
能不能说如果一个给定的因子集和的权重之和比另一个因子集和的所有权重之和更高就是说这些因子就会相对来说更好一些?
另外,对于多因子来说,要考虑到多重共线性的问题,据我所知,即使是利用非线性的优化算法如神经网络或者SVM之类,如果在因子之前做过PCA或者ICA之类的解耦工作,最后线性耦合度高的因子被去掉了以后,实际效果并不差,而且鲁棒性更好。那么现在bigquant上面是不是有这种因子PCA分析工作已经做了?如果没做的话,是不是能够提供有相应的接口可以提前供用户对feature即对多因子进行数据的定制化处理。也就是说是不是有从可以从父类继承的抽象类作为接口,这样派生的子类如果实现了抽象类接口,数据就可以被定制化处理了。
我的问题是:
-
现在在preprocessing阶段,多重共线性有否进行特殊处理?是不是已经做了
-
能否提供定制性接口让用户自行处理?
-
是否有相应的因子构造与筛选搭配方法可以写入文档?
-
现在量宽中主要用到的是何种方法,是基于多元线性回归还是深度学习?里面的优化参数部分是否可以有函数可以微调和自动优化?
\
\