递归神经网络RNN,长短期记忆细胞(LSTM)的分行业多因子预测 国信证券_20181228_
由small_q创建,最终由small_q 被浏览 58 用户
摘要
递归神经网络RNNRNN不同于传统神经网络的感知机的最大特征就是跟时间挂上钩,即包含了一个循环的网络,就是下一时间的结果不仅受下一时间输入的影响,也受上一个时间输出的影响,进一步地说就是信息具有持久的影响力。人们在看到新的信息的时候产生的看法或者判断,不仅仅是对当前信息的反应,先前的经验、思想也会参与到这次信息推断当中。
分行业建模往期系列报告中,我们尝试了不同神经网络模型在整个股票分析上的表现能力。 而股票市场中,经常观察到某一行业或者板块的股票在特定时期中表现出齐涨共跌的特征。这说明,在这些股票中,存在着某种行业性或产业性的共同影响因素。另外,根据产业周期理论,任何产业或行业通常都要经历幼稚期、成长期、成熟期、稳定期四个阶段。每个行业都处于各自的生命周期,其所属股票价格趋势也有不同特征。通过使用神经网络对不同行业单独进行分析,有利于抓住各个行业独有的影响因素,防止不同行业之间影响因素的相互影响,从而更精准的作出预测。
RNN网络训练在往期的报告中我们循着网络结构复杂度提高的方向简析了自适应计算次数ACT与维度叠加(Grid-LSTM)在多因子预测模型上的表现。随着网络结构复杂度加深,对计算机的性能要求越来越高。我们在本篇报告中采用对最普及的神经网络进行优化的方法,在复杂度一定的网络结构上尽可能提升网络的表现力。同时,在往期的报告中我们在把多因子输入时,都预先经过了一遍人工筛选;本次我们将获取的69个因子全部输入模型,让模型自己筛选,减少人工干预。对于神经网络的训练来说,由于采用月频数据作为训练集,训练集相对来说比较稀少,随着训练次数的增加,过拟合现象明显加重。采用单独的验证集验证神经网络可以有效地监测过拟合现象的产生,控制神经网络的无效训练次数。
训练结果分析通过神经网络对不同行业股票走势进行分析预测,我们观察到神经网络在不同行业的验证集上的表现随着神经网络训练次数的增加有不同的表现,我们认为这说明了不同行业对历史经验的依赖程度有差异。神经网络最终在大部分行业的预测准确率处于40%左右,与之前不分行业进行预测的准确率相差不大。训练所用样本集大小对训练表现有较大的影响,大样本集的验证准确度表现出过拟合前有较大的上升区间。
正文
/wiki/static/upload/4c/4cb6be7b-2dd4-412d-9ec6-ccb1882451f3.pdf
\