Artificial Intelligence in Day Trading: An Intraday Trading Framework with Economic Indicators and Large Language Model Analysis
创建于 更新于
摘要
本报告提出了一种基于宏观经济指标波动率的USTEC差价合约日内交易策略,并创新性地引入大型语言模型(LLM)进行新闻情绪过滤。策略通过2018年至2025年共1700余笔历史回测,基础策略累计收益达730%,年化收益33%,LLM增强版本进一步提升年化收益5个百分点。LLM优化信号筛选显著提升了策略的盈利能力、风险控制和alpha表现,且对提示词变动具有较好稳定性。本研究展示了AI驱动量化交易的潜力和未来在提示词工程及多模型结合上的发展方向。[page::0][page::3][page::6][page::10]
速读内容
策略设计与信号生成 [page::1][page::2]
- 利用美国宏观经济高影响力事件引发的市场波动,采用突破交易策略,基于公告后延迟120秒后评估价格区间波动信号。
- 通过卡尔曼滤波与Sigmoid函数构建交易指标(TI),设定买卖入场阈值,避免噪声干扰产生虚假信号。
- 风控措施包括1%止损、1.5%风险资金分配,仓位单独管理避免过度持仓,持仓在美国市场收盘前平仓。

大型语言模型(LLM)集成方案 [page::3][page::4]
- 通过DeepSeek Chat API,对经济指标公告进行情绪和前瞻偏差的实时情感分析。
- 以JSON格式接收“confidence”置信度,使用0.25和0.75的阈值分别过滤买入和卖出信号,提升交易信号准确性。
- 融合流程保证仅筛选具有量化实际值的公告,避免无效信息引入噪声。

回测结果与性能指标对比 [page::6][page::7]
| 指标 | 基础策略 | LLM增强版本 | USTEC买入持有 |
|-----------------|---------|------------|--------------|
| 总收益(%) | 730.59 | 982.93 | 205.42 |
| 年化收益(%) | 33.53 | 38.46 | 16.47 |
| 交易次数 | 1717 | 1401 | 1893 |
| 胜率(%) | 49.74 | 52.61 | 55.15 |
| 最大回撤(%) | -17.40 | -14.10 | -35.54 |
| Alpha | 0.51 | 0.65 | 0.00 |
| Beta | 0.03 | 0.03 | 1.00 |
| 夏普比率 | 1.67 | 2.11 | 0.61 |
| 盈利因子 | 1.27 | 1.41 | 1.11 |
- LLM集成版本显著提升收益表现及风险控制能力,表现出较强市场中性特征和超额收益。


LLM稳定性与提示词影响分析 [page::8][page::9][page::10]
- 不同提示词对LLM信心度分布影响显著,Prompt3具有明显看多倾向且带来最高Sharpe比率(2.11)。
- 重复同一提示获得高度一致的策略表现,体现模型输出的稳定性。
- 提示词调整阈值影响交易频率与绩效,但Prompt3仍优于普通策略,显示LLM过滤功能的可靠性。


方法论与未来展望 [page::4][page::11]
- 采用无日期、不使用修正值的初始经济指标数据,最大程度减少未来偏差,保证回测真实有效。
- 提出未来研究方向包括细化提示词工程、多模型集成(如RAG架构)以提升LLM在量化交易中的应用精度与稳定性。
深度阅读
金融研究报告详尽分析
报告题目: Artificial Intelligence in Day Trading: An Intraday Trading Framework with Economic Indicators and Large Language Model Analysis
作者: Zhuokai Chen
发布机构: 香港中文大学(深圳)
版本时间: 2025年5月6日
主题: 利用大语言模型(LLM)结合经济指标进行USTEC(纳斯达克100指数)差价合约(CFD)日内交易的量化策略设计与实证分析
---
一、元数据与概览
报告围绕一个创新的日内交易策略展开,核心是围绕美国宏观经济重要数据发布产生的市场波动,结合大语言模型(LLM)对新闻情绪进行分析,优化交易信号,从而提升交易效益。报告重点展示了以下特点:
- 策略核心:基于突破式交易信号捕捉公告引发的价格瞬态波动,通过大语言模型过滤信号提升策略质量。
- 回测时间范围:2018年至2025年,涵盖1,700多笔交易。
- 业绩指标:策略基础版本累计收益730%,年化收益33%;增加LLM过滤后,年化超额提升5个百分点,进一步提高年化收益至38%左右。
- 风险调整表现:显著超越买入持有基准,表现出极高的alpha(0.5以上)及低贝塔(0.03),为近乎市场中性策略。
- 研究意义:展示AI(尤其是大语言模型)在量化金融中有效利用非结构化信息(如新闻情绪)进行信号提炼的潜力,深化对量化策略的改良和未来研究方向(如prompt工程、多模型集成)的探讨。
综上,作者传达出一个结合宏观经济指标与AI智能技术,实现显著超额收益和风险控制的日内交易框架的核心信息。[page::0,1]
---
二、逐节深度解读
2.1 文献综述
聚焦宏观经济指标与LLM在金融领域的应用前沿:
- 宏观指标加强预测能力:引入VIX、经济政策不确定性指数、金融压力指数等提高标普500等市场预测准确率,且混合网络模型优于单一模型(Latif, 2024)。
- 经济新闻与市场波动非对称关系:Ryu(2022)揭示GDP等公布对市场情绪的复杂影响,强烈提示宏观新闻对日内扰动的重要性。
- LLM在金融文本分析优势:BloombergGPT等领域专用模型在财务分类与预测超越通用模型,LLM在收益预测和盈利变动判断方面优于人类分析师,尤其适合复杂信息环境。
- 研究空白:现有文献缺乏将宏观指标与LLM情绪分析结合于USTEC CFD的日内策略研究,用户基于这些前沿进行创新填补此空缺。
核心逻辑是利用宏观数据的规则性与LLM对非结构化新闻信息的解读能力互补,构筑更为精细且动态的交易模型。[page::0,1]
---
2.2 策略定义
2.2.1 骨干策略(Backbone Strategy)
- 信号构成:聚焦US重大经济事件引发的波动,利用突破价位捕捉强势行情。
- 事件类别:FOMC利率决议、非农就业、CPI/PPI、GDP、央行发言和PMI/零售销售等。
- 信号时点:报价延迟2分钟以过滤初始冲击波动并确保趋势显现。
- 指标设计:
- 价格阈值基于过去200分钟的高低点($N{\mathrm{lookback}}=200$分钟)。
- 整合卡尔曼滤波滤噪估测隐含价格趋势,计算归一化偏差$\delta$。
- 经过sigmoid函数转换得到交易指标(TI)。
- 买卖阈值:30为买入阈值,70为卖出阈值,中间缓冲区避免噪声干扰信号。
通过卡尔曼滤波减少价格噪声和异常,结合经济新闻触发的波动周期,策略旨在精准捕获趋势突破点。[page::1]
2.2.2 风险管理与仓位控制
- 使用1%的止损比例($P{\mathrm{stop}}=0.01$),根据信号与止损价差计算仓位大小,控制在约1.5%账户风险敞口($P{\mathrm{risk}}=0.015$)。
- 防止多重重叠订单,当前存在未触发止损订单时忽略新的交易信号,保证仓位安全。
- 交易结算前十分钟强制平仓,避免隔夜风险和持仓成本。
- 止损和仓位调整基于历史波动分析,保证灵活且稳定的风险控制。
参数均体现对波动性的敏感适应及账户风险均衡,注重资金管理的严谨性。[page::2]
---
2.3 大语言模型(LLM)集成
2.3.1 筛选经济指标
- 仅分析含有量化实际数据的公告(排除FOMC等无实际数值的新闻),确保新闻数据具备可计算偏差和意义。
- 多重事件同时发生时,使用平均置信度值避免纷杂信息带来的波动。
此部分保证LLM作用于高质量且时效性强的输入数据,排除杂音。[page::3]
2.3.2 LLM提示语设计
- 系统提示语要求LLM基于市场情绪和实际偏离预期值,输出结构化JSON格式,包括置信度(0到1)和简短原因。
- 用户提示语提供事件名称、实际值、预期值和历史值,促使LLM从具体数值差异推断市场情绪。
- 全过程基于DeepSeek Chat API,实现自动化接口调用与数据解析。
该设计利用提示语规范化输出,兼顾准确性和自动化处理需求。[page::3]
2.3.3 置信度应用及信号确认
- 买入信号:LLM置信度>0.25确认积极市场预期;
- 卖出信号:置信度<0.75确认不宜做多;
- 中间区间信号被否决,降低交易模糊性。
此机制提高信号精度,剔除过于模糊无效的交易建议。[page::3]
---
2.4 回测方法
2.4.1 避免前瞻性偏差
- 使用首次发布的(未经修正)经济数据,避免事后一览式数据导致的未来信息泄露。
- 事件名称固定,无具体日期信息输入LLM,避免模型通过时间戳获取未来信息。
- 选择经济指标的市场公告属性及命名统一性,降低模型获取不可用未来信息的可能。
全面遵循实盘条件模拟,提升回测可信度。[page::4]
2.4.2 数据与成本设置
- 使用IC Markets提供的纳斯达克100(USTEC)1分钟OHLC数据。
- 资金起点$10,000$,最大杠杆30倍,符合欧洲法规。
- 交易成本考虑2点点差,无佣金,包含周三三倍隔夜费利率。
- 结合MQL5经济日历数据同步回测LLM响应,确保历史决策时点一致。
确保环境真实性和策略适用性。[page::5]
---
2.5 重要指标解读
涉及多种指标衡量策略绩效及风险:
- Alpha/Beta:衡量策略超额收益和市场相关性。
- Sharpe比率:风险调整下收益率。
- 盈利因子:总收益与总亏损比,表现盈利质量。
- 最大回撤:测量策略的最大潜在亏损幅度。
- 交易次数及胜率:活跃度和成功率指标。
- 与USTEC买入持有比较:检测策略增值能力。
指标多维度评价,体现策略稳定与高效的交易能力。[page::6]
---
2.6 结果与讨论
2.6.1 盈利能力分析
表4对比基础策略、结合LLM版本及基准买入持有:
| 指标 | 基础策略 | LLM版本 | 基准买入持有 |
|---|---|---|---|
| 累计收益率 | 730.59% | 982.93% | 205.42% |
| 年化收益 | 33.53% | 38.46% | 16.47% |
| 交易次数 | 1717 | 1401 | 1893 |
| 胜率 | 49.74% | 52.61% | 55.15% |
| 最大回撤 | -17.40% | -14.10% | -35.54% |
| Alpha | 0.51 | 0.65 | 0 |
| Beta | 0.03 | 0.03 | 1.00 |
| Sharpe比率 | 1.67 | 2.11 | 0.61 |
| 盈利比率 | 1.27 | 1.41 | 1.11 |
- LLM版本年化收益提升约5个百分点,交易次数减少但胜率和盈亏效率均提高,显示信号筛选有效。
- 最大回撤明显降低,风险管控更优。
- Alpha显著正值,确认策略获得持续超额收益,且低市场相关度确保策略独立性与分散价值。
- Sharpe和盈利比率突出,体现风险/收益平衡能力优化。
图3 (净值曲线)显示2018-22年三条曲线走势接近,随后LLM版本明显超越;图4 (回撤曲线)显示LLM版本在多次市场波动期间表现稳健,最大减损小于基础策略及基准。
图5(日收益率分布)左尾缩短、右尾拉长,表明策略避免极端亏损并捕捉较大上涨机会,LLM版本尤为显著,证明情绪过滤提升了收益质量。
整体来看,LLM环节有效提升了策略的盈利性和稳健性,体现AI在量化交易中的价值。[page::6,7,8]
---
2.7 LLM稳定性及可解释性研究
- 设计三类不同提示语(Prompt1、Prompt2、Prompt3),并对同一Prompt3重复两次采样,从输出置信度分布和策略表现进行比较。
- 置信度分布(图6):Prompt1/2均匀、中性,平均置信度约0.53;Prompt3偏向积极,均值0.64。提示词措辞对模型偏向存在显著影响,模型决策呈黑盒特征。
- 仅半数置信度转换为交易信号,体现策略严格信号筛选。
- 绩效对比:Prompt3表现最佳(总收益98.29%,Sharpe 2.11),Prompt1/2表现逊色接近基础策略。
- 调整信号阈值(从0.25/0.75变为0.35/0.65)减少交易次数,略微影响绩效,表明过滤灵敏度需平衡。
- Prompt3重复使用结果高度一致(略有微小差异),验证LLM在相同输入下稳定性不错。
本节揭示了Prompt设计对LLM输出和金融决策影响巨大,模型具备一定稳定性,但缺乏完全透明的逻辑解释,提示未来需结合更多可解释技术和prompt工程深化研究。[page::8,9,10]
---
三、图表深度解读
图表1:策略参数优化表(第2页)
列举包括新闻延迟(120秒)、回看窗口(200分钟)、交易指标阈值(30/70)及卡尔曼滤波噪声等关键参数,各参数基于经验数据调优,体现对市场噪声和波动变化的平衡处理,保障信号灵敏但不过度扰动。
图1:典型交易执行图(第2页)
展示2025年1月7日某笔策略下达卖出止损单位置及经济数据公布时间,可见卖单设置在过去200分钟最低价处($L{200}$),价格随后明显下跌,策略成功捕获波动并实现盈利,验证突破策略的实操路径。

---
图2:策略流程图(第4页)
清晰展示策略执行逻辑:
- 宏观经济新闻发布触发信号生成。
- 交易指标(TI)检测是否通过阈值。
- 通过者传递至DeepSeek LLM获取置信度。
- 置信度判断是否放行交易信号。
- 符合标准的信号激活挂单。
该流程体现二层过滤设计结构,增强了信号的有效性和系统自动化特性。

---
表3:回测参数表(第5页)
确认回测环境(时间跨度2018-2025)、品种(USTEC CFD)、数据频率、交易成本和资本规模等设定,反映实验设计贴近真实市场交易环境。
---
图3(第7页):净值曲线
明显显示LLM策略稳步超越基础策略和买入持有,尤其2022年后LLM版本曲线陡峭,资金增长迅速,验证了当前策略的长期收益优势。

图4(第7页):回撤曲线
LLM版本最大回撤显著低于基准和基础策略,反映出更优的风险控制能力。

---
图5(日收益分布,第8页)
LLM版本的收益分布左侧较为紧凑,右侧分布更长尾,说明该版本更能有效控制大幅亏损,同时抓取正收益机会,符合风险回报优化目标。

---
图6:置信度分布(第9页)
不同提示词产生截然不同的置信度分布,特别是Prompt3呈现明显向高置信度倾斜,暗示提示词中“impact”一词引导模型偏向多头看法。

---
图7:不同提示词策略净值曲线(第10页)
再次验证Prompt3具有最佳业绩和稳定性,且重复调用表现接近,验证模型输出稳定性和提示设计的重要性。

---
四、估值分析
由于本报告主要为策略研究及回测表现展示,未涉及股票估值或市场估值内容,故无传统DCF、市盈率或EV/EBITDA等估值分析。关注点在风险调整回报引导的策略收益评估。
---
五、风险因素评估
报告指出的主要风险包括:
- 前瞻性偏差(Look-ahead Bias)风险:利用首次发布数据、排除时间信息、谨慎的模型输入设计显著减少此风险。
- LLM输出的黑盒及幻觉风险:LLM可能产生不准确或误导性置信度,影响策略交易决策。通过多提示测试及重复验证,降低此类风险影响。
- 市场结构变化风险:策略依赖历史波动规律和事件影响力,市场结构或新闻反应方式发生根本变化可能削弱策略有效性。
- 执行风险:高频事件下活跃挂单可能因流动性不足或滑点造成损失,但策略设计考虑了交易成本和资金管理强制止损,减低实际损失。
风险控制通过严格策略设计、资金管理和稳健验证过程体现,但依旧存在技术和市场因子不确定带来的潜在风险。[page::4,8]
---
六、批判性视角与细微差别
- 策略收益源自明显波动和宏观新闻反应,后续结构性市场环境变化可能降低收益稳定性。报告侧重利用事件驱动,若市场对传统经济数据敏感度减退,策略表现或受限。
- LLM的黑箱性质与提示语依赖性凸显,策略表现对提示语选择较为敏感,存在一定主观设计成分。
- 采用的回测方法严格限制未来信息引用,但未详细披露对突发非预告新闻的处理,实际应用中该类新闻或对策略影响较大。
- 数据和成本假设均基于一定平台和时间点,存在市场费率流动性等变化不确定性,可能影响实盘表现。
- 策略对资金规模和杠杆的限制符合欧洲监管标准,适用范围较明确,但对其他市场或杠杆环境适应性未探讨。
总体而言,策略框架严谨,但依赖历史复现的市场行为,未来拓展需注意模型与市场环境的动态匹配及LLM应用的可解释性增加。
---
七、结论性综合
本文构建了一个结合经济指标突发事件引发波动的基准突破交易策略,并利用大语言模型(LLM)进行新闻情绪分析过滤,提高交易信号质量。系统回测显示:
- 基础策略从2018至2025年实现超700%累计收益,年化33%;
- LLM过滤后年化收益提升至约38%,风险指标有所改善(最大回撤减少,Sharpe比提升);
- 策略在市场中性条件下实现显著alpha贡献(>0.5),同时保证低贝塔风险敞口(0.03),具备优秀风险调整能力;
- 过滤信号的LLM模块表现出良好的稳定性,同一提示重复获得接近结果,提示词设计是关键影响因素;
- 策略明确规避前瞻性偏差,符合实盘条件模拟,提升回测可信度;
- 图表分别展现了策略净值、回撤及收益分布的实证优势,尤其LLM集成版本在股市调整期间显示出抗跌稳健性。
研究不仅验证了AI大模型在量化金融情绪解析中的潜力,还为未来开展Prompt工程和多模型集成指明方向。总体而言,论文展现了结合宏观数据驱动与AI情绪理解的创新交易框架,既显现超额收益能力,也揭示了模型设计与风险管理的复杂性。为金融领域AI整合提供了实证和方法论支持,开启量化策略与机器学习交叉融合的新篇章。[page::10,11]
---
备注:所有引用均严格对应原文对应页码,保证内容可追溯与验证。