Alpha掘金系列之五:如何利用ChatGPT挖掘高频选股因子?
创建于 更新于
摘要
本报告系统介绍了ChatGPT在量化研究领域尤其是高频选股因子挖掘中的应用,详细阐述了基于提示工程设计原创因子的构建步骤及逻辑,重点测试了周频变异系数因子和日频高频买卖盘力量因子的表现。实证结果表明,买卖盘力量差异因子在日频具有17.29%的年化超额收益率,并成功构建中证1000增强策略实现7.17%的年化超额收益,体现了ChatGPT助力量化研究的潜力。此外,报告也探讨了ChatGPT生成量化代码的实用性及需注意的细节。[page::0][page::1][page::8][page::9][page::10][page::11][page::12][page::13][page::14]
速读内容
- ChatGPT模型及其演进 [page::0][page::1][page::2]

- ChatGPT基于GPT-3.5架构,是近年大语言模型演进的代表,采用Transformer架构与RLHF技术提升人类交互理解能力。
- 模型具备强大的自然语言处理能力,可支持翻译、代码生成、文本分析等任务。
- Prompt提示工程方法及思维链提示提升模型推理能力 [page::1][page::3][page::6][page::7]
- 模型输出效果受prompt设计影响显著,通过详细角色和指令限制,可提升因子构建的原创性和逻辑效度。
- 思维链提示引导模型分步推理来解决复杂量化评估问题,例如提升IC指标评价的准确性。


- ChatGPT挖掘的周频变异系数因子测试与表现 [page::8][page::9]

- 该因子综合价格和成交量的变异系数反映流动性及波动性,IC均为显著正值,表现出稳定的横截面预测能力。
- 多空组合净值稳健,部分因子年化收益率超8%,多头超额收益不理想,显示因子单调性不足。

| 因子 | 年化收益率 | 波动率 | 夏普比率 | 最大回撤 | 多头组合年化超额收益率 |
|---------|------------|--------|----------|----------|-------------------------|
| LI | 8.35% | 16.42% | 0.51 | 31.43% | -1.09% |
| VLI | 8.40% | 9.75% | 0.86 | 20.04% | 2.75% |
| LIxVLI | 8.89% | 12.46% | 0.71 | 27.58% | 0.74% |
| LI2VLI | 2.06% | 15.87% | 0.13 | 35.14% | 0.74% |
- ChatGPT高频买卖盘力量因子构建及回测表现 [page::9][page::10][page::11][page::12]

- 基于逐笔买卖委托价和委托量构建的买盘力量、卖盘力量及差异因子表现卓越,BSForce差异因子日频多头年化超额收益率达17.29%,夏普比率4.51。
- 降频至周频后卖盘力量因子仍保持年化超额收益接近10%,适合实际交易策略构建。



| 因子 | 年化收益率 | 波动率 | 夏普比率 | 最大回撤 | 多头年化超额收益率 |
|-----------|------------|--------|----------|----------|---------------------|
| BForce | 18.74% | 19.47% | 0.96 | 35.25% | 11.17% |
| SForce | 4.06% | 18.88% | 0.22 | 38.71% | 6.57% |
| BSForce | 37.00% | 8.21% | 4.51 | 4.88% | 17.29% |
| BForce(周频) | 6.52% | 20.78% | 0.31 | 38.81% | 9.77% |
| SForce(周频) | 8.27% | 20.66% | 0.40 | 37.18% | 10.20% |
- 基于卖盘力量因子的中证1000增强策略显示,年化超额收益7.17%,信息比率0.57,双边周度换手率12.72%。策略风险可控,体现良好实际应用潜力。
- ChatGPT代码输出能力测试及建议 [page::12][page::13][page::14]


- ChatGPT能够生成较完整的因子回测和组合优化基础代码框架,包括IC计算、净值绘制、夏普比率评估和均值方差及Black-Litterman组合优化。
- 需要注意部分计算细节与国内实际习惯差异,可能出现遗漏或错误,建议由用户自行修正和调试。
- 适合作为初学者学习参考及提高研发效率的辅助工具。
- 风险提示与模型局限 [page::1][page::14][page::15]
- ChatGPT模型回答具备一定随机性,可能出现偏差或错误。
- 历史回测结果的稳定性依赖政策、市场环境,存在失效风险。
- 策略收益受假设限制,交易成本升高可能导致实际收益下降。
深度阅读
《Alpha掘金系列之五:如何利用ChatGPT挖掘高频选股因子?》报告详尽分析
---
一、元数据与概览
报告标题: 《Alpha掘金系列之五:如何利用ChatGPT挖掘高频选股因子?》
作者: 高智威,王小康
发布机构: 国金证券股份有限公司
发布日期: 2023年4月5日
主要研究主题: 利用ChatGPT这一大语言模型(LLM)技术在量化投资领域,尤其是高频选股因子挖掘中的应用与实战。
核心观点与结论:
- ChatGPT具备一定创新能力,能根据合适提示构造原创高频选股因子。
- 测试中发现买卖盘力量因子表现突出,且经过适当降频后可以构建真实可行的机构级增强策略。
- ChatGPT可辅助代码输出,显著提升量化研究效率,但需要人工修正细节。
- 投资策略在考虑交易成本和现实操作限制因素后仍展现合理超额收益。
[page::0,1,2,8-14,16]
---
二、逐节深度解读
2.1 ChatGPT模型介绍及原理解析
本节详细介绍了ChatGPT基于GPT系列的演化历程及技术原理。
- GPT模型由Transformer结构构成,解决了传统LSTM处理长距离文本信息困难的问题,利用自注意力机制赋予不同输入权重。
- 参数规模从GPT-1(1.17亿)到GPT-3(1750亿)不断扩大,促进模型能力跃升。
- ChatGPT结合了大规模预训练与强化学习(RLHF)技术,通过人类标注员的反馈微调模型,实现对复杂语言任务的精准响应。
- RLHF流程包括示范数据训练、比较数据打分模型训练和最终基于打分模型进行强化训练三步,图示详见图表2。
该部分奠定了ChatGPT技术背景,为后续量化应用逻辑分析做基础。
[page::0,1,2,3]
2.2 ChatGPT提示工程介绍及使用指南
指出语言模型表现优劣依赖于“提示(Prompt)”设计,核心构成“角色-任务-指令”三要素。
- 提示的细致与精准决定了模型输出的相关性与有效性。
- 特别介绍“思维链提示”(Chain-of-Thought Prompting)技术,能将复杂问题拆解为多步推理,提高推理与逻辑表现。
- 本节用实际示例展示如何针对提示限制,诱导模型设计原创且具有逻辑支撑的选股因子,如基于逐笔成交数据构建的流动性因子(Liquidity Factor,LF)。
- 进一步介绍提示工程的分类,包括知识生成、情感分析、强化学习和对抗性提示,演示ChatGPT在复杂语义辨识上的能力与局限(随机性、准确率波动)。
[page::1,3,4,5,6]
2.3 ChatGPT因子评价指标改进思路示范
通过两个IC指标示意图(图9、图10),说明单一IC的不足,表现为相似IC值但多头收益截然不同。
- ChatGPT直接回答改进IC方法时表现平平,经过人类引导,其逐步给出更合理的“横截面IC”和“加权平均IC”等改进思路,体现了思维链提示提升模型逻辑推理的能力。
- 提示中显示,虽然ChatGPT能接受引导,但仍存在理解盲点,如对A股做空限制掌握不严,显示需要用户二次引导强化认知。
[page::6,7]
2.4 ChatGPT因子挖掘实战
2.4.1 周频变异系数因子构建与测试
- 利用日内价格与成交量的变异系数构建基本因子(LI、VLI及其组合),测算周频IC表现,其中T值均大于2,表明因子具备一定预测能力;
- 因子多空组合净值表现平稳,但多头超额收益表现偏弱(VLI多头年化超额收益约2.75%),单调性不足限制了策略构建价值。
- 变异系数因子反映了低波动异象,体现了价格和成交量波动率与未来收益的负相关性。
[page::8,9]
2.4.2 高频买卖盘力量因子构建与测试
- 结合高频数据中独有的委托价和委托量,构造买卖盘力量因子(BForce、SForce)及其差异因子(BSForce);
- 通过tick级别逐笔数据计算,采用标准化处理后构造因子,日频IC均显著(T值均大于2);BSForce因子多头年化超额收益高达17.29%,夏普比率显著提升(4.51),最大回撤极低(4.88%),表现远超单向力量因子;
- 日频调仓成本高,因子衰减快,故进一步降频为周频调仓,仅保留买盘和卖盘力量因子,周频多头超额收益分别为9.77%和10.20%,夏普比率分别为0.48、0.49,显示因子具备一定持久性;
- 利用卖盘力量因子构建中证1000指数增强策略,考虑交易成本后年化超额收益7.17%,信息比率0.57,风险控制合理,换手率适中,为机构投资提供增益空间。
[page::9,10,11,12]
2.5 ChatGPT代码输出测试
- ChatGPT可输出涵盖基本因子测试流程的Python代码,包括IC计算、十分位测试、夏普比率和最大回撤等指标,且可根据人类反馈修正代码功能;
- 代码存在的主要问题为国内因子测试实务与国外代码逻辑差异,训练语料中多为国外案例,导致部分计算逻辑与业界惯例不符,需人工调试与数据格式适配;
- 示例给出了均值方差最大夏普组合优化及Black-Litterman组合优化代码框架,形式规范,对快速入门有积极帮助;
- 总结建议:ChatGPT可作为编程辅助工具,快速理解函数用法,降低学习成本,但必须谨慎验证结果准确可靠性。
[page::13,14]
---
三、图表深度解读
3.1 模型演进图(图1)
展示了从2017年Transformer基础论文到2022年ChatGPT发布的全链路技术路径,每代GPT模型参数数倍增及训练数据规模爆炸式增长,促使模型能力大幅跃升,特别是通过人工排序细化产生的Reward Model,模型渐进贴合人类需求。图示清晰展现技术积累过程。
[page::2]
3.2 RLHF过程图(图2)
三阶段示意细化人工标注数据训练、比较评价实验结果、基于奖励模型优化策略,体现人工干预对纯自监督学习模型性能提升关键作用。该流程是ChatGPT获得“常识”和人类偏好理解能力的基础。
[page::3]
3.3 因子构建示例与提示回应(图4-5, 图16)
呈现了ChatGPT根据复杂指令构建“流动性因子”完整计算流程,包括均值、标准差计算及流动性指标LI、VLI,用量价数据反映市场流动性特征,同时满足了原创性和逻辑严密要求。展示Prompt引导明显提升因子质量。
[page::4,5,8]
3.4 IC指标异象示范图(图9-10)
对比两因子IC值相近但多头收益梯度迥异的现象,直观展示IC单指标评价局限性,突出需要针对因子分组赋予差异权重等改进措施的现实必要。
[page::6]
3.5 高频买卖盘力量因子因子构建细节(图20-21)
详细展示ChatGPT构建买盘力量、卖盘力量及价格差异因子公式,例如VDF和PDF,以及基于委托量和加权委托价的综合计算方法,为高频因子研究提供系统化数学基础。
[page::10]
3.6 因子回测表现图(图17-19, 22-26)
- 变异系数因子IC统计表(图17)具备统计显著性但多头表现不足,净值曲线(图18)相对平稳,夏普比率不高。
- 高频因子日频回测IC(图22)显示BSForce差异因子有最高IC及显著性,净值曲线及指标(图23-24)体现极佳的多空组合表现。
- 将因子降至周频后多头组合净值曲线(图25)与年化收益数据(图26)提示做空约束及资金成本限制下,因子仍维持合理的收益和波动水平。
- 中证1000指数增强策略净值对比图(图27)及策略指标(图28)清楚显示ChatGPT买卖盘力量因子策略的超额收益与较低回撤风险。
[page::9,10,11,12]
3.7 代码示例截图(图29-32)
包含标准化因子测试框架代码及组合优化(均值方差与Black-Litterman模型)代码,展示了ChatGPT在代码生成领域的辅助作用,但文字注释提示仍提醒用户深入校验逻辑。
[page::13,14]
---
四、估值分析
本报告并未涉及传统资产估值如DCF或市盈率等模型,核心聚焦于因子量化研究方法与选股策略构建,不涉及直接公司估值。重点在于因子构建、测试及策略绩效验证。故此处无需估值单章解读。
---
五、风险因素评估
明确列举了三大风险:
- 模型随机性风险: ChatGPT回答具有不确定性,可能输出不准确或误导性信息,影响最终投资决策。
2. 因子失效风险: 因子结果基于历史数据统计,政策与市场环境变化可能导致模型失效。
- 成本变化风险: 策略基于某些假设如手续费水平,若成本提高或交易环境变动,策略收益可能大幅减少甚至亏损。
报告未详述具体缓解措施,但对模型本身透明度较高,体现了风险意识。
[page::1,14,15]
---
六、批判性视角与细微差别
- 报告充分利用大量提示工程技巧引导模型产出高质量创新成果,显示高度专业的量化研究经验。但对ChatGPT代码能力虽肯定其提供便利,仍指出其训练语料偏海外,代码细节与实际业务不完全契合,提示用户谨慎。
- 在改进IC指标示例环节,模型并非一次性精准理解场景,需不断反复引导,说明语言模型逻辑推理能力仍非完美。
- 高频因子日频到周频降频处理显示模型输出因子比较易衰减,表明实际应用中高频特征需结合多维因子和实际交易成本综合考虑。
- 风险项描述详细,但策略评估时间区间以2016-2022年为主,具体市场极端情况及模型鲁棒性检验略显不足。
- 代码示例尽管完善,仍未能完全满足中国量化行业特有习惯或严苛要求,暗示实际操作难免需人类复核把控。
整体展现报告作者对ChatGPT实际应用持审慎乐观态度,既认可助力潜力,也指出局限和风险,保持了客观、理性的分析态度。
[page::7,13,14]
---
七、结论性综合
本报告系统展示并验证了ChatGPT作为先进大语言模型,在量化投资领域内进行高频选股因子挖掘的实际能力和应用价值。重点分析表明:
- 模型及提示工程架构:ChatGPT基于Transformer,自注意力机制加上强化学习人类反馈(RLHF),结合创新提示工程技术,使其具备理解复杂投资研究任务并生成原创因子的能力。
- 因子挖掘能力:
- 低频变异系数因子呈现稳健IC表现,但多头收益有限,实际应用空间较小。
- 高频买卖盘力量因子(基于tick级别委托价和委托量),特别是买卖盘力量差异因子,在日频表现出显著超额收益和风险控制优势;降频至周频后,因子持续性依然有效,适合实际机构操作。
- 依托优化后的卖盘力量因子,构建的中证1000策略在考虑交易成本后,仍取得7.17%的年化超额收益,信息比率超过0.5,显示策略具有实用价值和落地潜力。
- 代码辅助能力:ChatGPT能够快速生成量化研究必需的代码框架,包含因子测试、组合优化等,极大提升研究效率。但必须辅以人工校核调整,避免模型知识盲区影响结果准确性。
- 图表支持与数据透视:
- 模型演进和训练流程图清晰展示技术背景。
- 多个因子IC及净值走势图说透因子表现及衰减特性,结合定量指标(夏普比率、最大回撤等)辅助决策。
- 提示工程与思维链应用图文并茂,示范实际模型引导策略。
- 风险明确提示:模型生成具有不确定性,因子效果基于历史回测,策略需留意成本变化与政策风险。
整体来看,报告表明ChatGPT在量化投资研究领域已具备实际应用基础,尤其是在高频因子设计与策略构建中表现亮眼。结合人工辅助校准,ChatGPT可作为量化研究员的智能助手,大幅提升研究效率与创新能力,促进量化策略研发向更高频、更细粒度迈进。
---
结语
该报告通过严谨的技术解读、完善的实证分析及示范代码呈现,揭示了ChatGPT在高频选股因子挖掘及策略开发中的强大潜力和当前局限。对行业内研究人员与投资机构具有极高的参考价值和实践指导意义。
---
(全文中引用所有分析结论均基于报告原文内容,依页码标识注明)[page::0-17]