策略分享

优秀策略分享——数据标准化策略

由bqpguj9o创建,最终由bqpguj9o 被浏览 4 用户

影响策略效果的因子有很多,每个人所选择的因子也各有不同,选取因子后,如何分析数据,找出有效选股逻辑模型就成为重点。该数据分析工作是策略逻辑编写中最耗时的部分,本文介绍,如何简化数据分析的工作:数据标准化处理


举例说明:

当天收益因子:5000支票,可能会有1000+个不同的值,如:1.01%,1.02%, -0.1%,-0.2%….,实际上收益值1.01%,1.02%对于策略数据分析来说,理论上无本质区别,固1.01%、1.02%这类数值接近的值,需要把它标准化为同一个值,就可以大大提升数据分析上的效率


数据标准化处理方法:

1、可以按天为维度,把因子的值,按数量划成n等份,如:

df[‘return0'] = pd.qcut(df['return0'],q=10,labels=False,duplicates="drop")

这样标准化处理后,当天收益这个因子的值,就会变成1、2、3….10

2、可以按天为维度,把因子的值,按值的整体区间划成n等份

3、可以按因子值的整体区间,按数量划成n等份或按值的区间划成n等份

4、可以自定义数值区间进行数值转化,如:1%至2%之间,因子值转化成1,2%-4%之间,因子值转化成2

具体数值转化的代码编写方法,也比较简单,可以用deepseek等AI工具,让它帮你写下代码转化


下面我的这个策略就是用此方法做数据分析后,编写的策略:

主要用到的因子:大盘情绪因子类、板块特征因子类、个股量价/相对位置/排名等因子类

回测效果:

上架到模拟盘运行效果:

{link}