2026年SAIF手搓因子大赛
比赛时间: -
数据驱动未来,代码挖掘阿尔法(Data Drives the Future. Code Mines the Alpha)
主办方:上海高级金融学院
比赛介绍
## **赛事介绍**
在上海交通大学高级金融学院量化投资俱乐部的推动下,我们特别举办此次量化因子开发挑战赛。量化投资作为金融科技与资产管理的核心方向,正深刻改变着市场的投资逻辑与实践方式。阿尔法因子(Alpha Factor)作为获取超额收益的关键工具,其有效构建与迭代已成为量化研究的重要课题。
作为专注于金融前沿研究与人才培养的高端平台,高金量化投资俱乐部始终致力于搭建学界与业界的桥梁,推动量化理论与实战的深度融合。我们相信,卓越的量化能力不仅来自扎实的理论基础,更源于真实的场景锤炼与开放的创新协作。因此,本次赛事将开放稀缺的、高质量的A股市场分钟级行情数据,邀请来自高金及兄弟院校的优秀学子与行业同仁共同参与,体验从数据到策略的全流程实战。
参赛者将基于日频因子数据,围绕中证1000指数成分股,在指定的时间范围内构建具有预测能力的创新因子。
通过本次竞赛,您将有机会:
- 掌握大规模金融时序数据的处理方法与分析技巧;
- 深入理解市场微观结构与因子构建的逻辑;
- 体验顶级量化机构在实际研究中面临的挑战与解决方案;
- 与业界专家、学院导师及同行进行深度交流与学习。
## **数据说明**
本次竞赛提供高质量的A股市场日频因子数据,具体如下:
* **股票池**: 中证1000指数在历史相应时间点上的成分股。
* **时间范围**: 2024-01-01至2025-12-31。
* **数据频率**: 日频因子数据。
* **数据内容**: 包含量价、基本面、基础信息、高频等因子数据。
## **模版代码**
本次竞赛采用”**日频因子组合**”的方式,平台提供日频因子数据,参赛者构建可以选择因子和模型生成最终单因子并提交。主办方将提供如下多个模版代码供参赛者参考:
* 用线性规则的方式生成因子,参考 demo_linear.ipynb。
* 利用机器学习算法构建AI因子,参考 demo_ai.ipynb。
## **赛程安排**
### **阶段一:报名**
* **时间周期**:2026-01-18 至 2026-01-25
* **报名和组队**:通过活动主页进行报名,或联系兴趣团老师。可单人或多人组队(单一队伍最多不超过3人)。
### **阶段二:线下比赛**
* **时间周期**:2026-01-25 13:30:00 至 17:00:00
* **运行机制**:参赛队伍可利用平台提供的数据开发因子并按照规范提交代码,平台会使用验证集数据构建对应的因子数据并打分实时更新排名,以队伍最好的一次得分进行展示在”公榜(Public Leaderboard)”上。
* **账号与数据发放**:向所有成功报名的队伍发放比赛专用账号,开放数据访问权限。
* **颁奖典礼**:当日现场公布最终名次。
## **评估**
本竞赛排名将完全基于量化评估。评估分为两个步骤:数据检测和得分计算。
1. **数据检测**:您提交的因子必须首先通过以下所有检测,否则将被视为无效提交。
* **数据列检查**:因子数据文件必须且仅包含三列:`date` (交易日), `instrument` (股票代码), `factor` (因子值)。
* **交易日完整性检查**:因子数据不能缺失所要求时间范围内的任何一个交易日。
* **因子覆盖度检查**:在每个交易日,因子值缺失率不得高于 **40%**。
2. **数据处理**:通过数据检测后,系统会将您的因子数据与 BARRA 风险因子进行回归取残差作为新的因子,剔除风格因子的影响。
3. **最终得分**:系统将基于您的因子值计算**IC均值、ICIR、夏普比率、换手率**等指标,并依据各参赛者在这些指标上计算最终**排名**,按以下公式计算最终得分:
$$
Score = 0.4 \times \text{Rank}_{IC_{mean}} + 0.3 \times \text{Rank}_{IC_{IR}} + 0.2 \times \text{Rank}_{SR} + 0.1 \times \text{Rank}_{Turnover}
$$
其中,$\text{Rank}_{指标}$ 代表该指标在所有参赛者中的实时排名(数值越小,表现越优)。最终得分是四项指标排名的加权和,得分越低,代表综合排名越靠前。
### **提交文件**
在本次比赛中,您只需要按照**模版代码**里的例子,将因子构建代码写在**main**函数中并提交,平台会自动运行生成因子数据,计算得分并实时公布。但需要注意,要保证**main**函数的返回数据格式应遵循特定格式,比如:
| date | instrument | factor |
|------------|------------|-------|
| 2023-01-03 | 000001.SZ | 0.05 |
| 2023-01-03 | 000002.SZ | -0.12 |
| ... | ... | ... |
## **代码要求**
本次竞赛为代码竞赛,所有提交必须通过合作的线上量化平台完成。为保证竞赛公平性,您的代码需满足以下条件:
* **平台提交**: 所有因子生成代码必须在指定的线上平台Notebook环境中运行并提交。
* **禁止访问外部网络**: 为防止信息泄露和使用未来数据,Notebook的互联网访问权限将被禁用。
* **外部数据**: 禁止使用未经官方许可的任何外部数据。
* **最终提交**: 您提交的必须是可以自动运行并生成因子文件的代码,而非因子数据文件本身。
## **竞赛规则**
* **知识产权**: 参赛作品(代码、报告等)的知识产权归参赛队伍所有。主办方对所有作品拥有非商业性的评审、展示和宣传权利。对于获奖的优秀因子,主办方在同等条件下拥有优先的商业合作洽谈权。
* **最终解释权**: 本赛事所有规则的最终解释权归上海交大高金学院量化投资俱乐部量化大赛组委会所有。

