交易数据

BigQuant量化交易平台拥有DATA金融量化交易数据平台，金融数据是量化交易软件的核心组成，DATA量化交易数据平台覆盖了股票、债券、基金、期货、期权、指数、量化因子等各类数据，同时用于研究开发传统量化策略和AI算法模型，可以通过BigQuant的DAI量化交易数据平台API接口读取。量化交易数据在金融领域中占据核心地位，它是市场动态、投资者行为及经济趋势的实时反映。通过分析交易数据，金融机构能够洞察资金流动、价格形成机制及市场风险，进而为投资策略、风险管理和产品创新提供有力支撑。随着大数据和人工智能技术的发展，量化交易数据的分析和利用愈加精准高效，已成为金融市场竞争力的重要保障。

研报复现：【中金证券】如何利用日内交易数据左侧预警机构成交拥挤度

https://bigquant.com/codesharev3/4fa7f395-3835-4de0-992d-bf48393f6593

参考资料：

中金量化及ESG: 中金 | 如何利用日内交易数据左侧预警机构成交拥挤度

虽然没有达到理想效果，但至少可以作为傅里叶变换相关算法的实现参考。

更新时间：2025-12-22 03:53

【数据建议】【集合竞价表】【cn_stock_bar1m_derived表】

1. 可以增加未匹配的金额吗（9点25分的tick）？2. 这个数据需要早盘更新，不能是下午17点

%%sql
select
    date,
    instrument,
    open_auction_order_volume	as	竞价总委托量,
    open_auction_cancel_volume	as	竞价总撤单量,
    open_auction_trade_volume	as	竞价总成交量,
    open_auction_order_volume-open_auction_cancel_volume-open_auction_

更新时间：2025-12-09 13:00

股票市场高频交易与期权做市成本

文章背景

高频交易（HFT）通过高速交易和复杂的算法在金融市场中迅速崛起，显著改变了电子市场的运作方式。尽管已有大量文献研究了HFT对单一市场质量的影响，但很少有研究探讨HFT在不同资产类别（如股票和期权）之间的跨市场影响。本文填补了这一空白，研究了股票市场中的HFT活动如何影响期权市场的流动性。

研究方法与数据

研究使用了2009年纳斯达克HFT数据和期权价格报告机构（OPRA）的交易数据，覆盖了103只股票。主要变量包括HFT的交易量、期权市场的买卖价差、期权的隐含波动率、Delta、Gamma和Vega等。此外，还使用了CBOE的开收盘期权数据、Refinitiv的五分

更新时间：2025-03-03 02:51

【其他】Stockrank与梯度函数因子一起使用出现未来函数现象

做了一个关于2日均线的梯度因子，如下，将其放入Stockrank中呈现非常好的收益，怀疑有未来函数，投放模拟盘后无交易数据输出，但是放在xgboost求解器里没有这种现象发生，模拟盘也正常输出，所以是梯度函数和StockRanker一起使用导致的吗？原理上均线数据是用过去数据构成的，应该不会造成未来。梯度函数按np里的帮助应该也是用过去数据构成的，不会造成未来，所以很迷惑，希望有工程师能帮忙查一下。下面分别是因子分析，sr，xgb的策略，因子分析的收益看起来就很离谱，但似乎并不影响xgboost的结果.，还是说系统在处理梯度函数时带入了未来数据？

[https://bigquant.co

更新时间：2025-02-15 15:30

【平台使用】回测模拟模块问题

一个最基本的策略测试，发现回测模块买卖和持仓数据不符合逻辑，不知是什么问题？

在print 中的交易数据与回测模块中的详情完全对不上！回测模块中没有买的股票，怎么有持仓？

买卖也不对！

https://bigquant.com/experimentshare/bac3a381371b4b338a84bbd3092e8398

更新时间：2025-02-15 14:32

同花顺涨停a股市值20230928

https://bigquant.com/codeshare/d9fc6c92-ad4a-47ea-872b-72f95c28dce4

更新时间：2023-09-27 02:30

港股研究系列：Barra模型及应用-东北证券20180718

摘要

随着陆股通的推进，内地投资者对港股的关注度也越来越高。在本报告中，我们对港股 Barra 模型进行了介绍，并对数据结果及应用进行展示。

数据是分析的基础。我们在本地搭建了港股基础信息、行情序列、交易数据、恒生行业分类、股票估值数据、资产负债、利润和现金流量等数据表。港股数据质量相对于 A 股存在一定不足，还需进一步完善。

对于行业分类，我们使用的是恒生一级行业分类：公用事业、原材料业、地产建筑业、工业、消费品制造业、消费者服务业、电讯业、综合企业、能源业、资讯科技业和金融业；风格包括市值、贝塔、动量、波动率、非线性市值、BP、流动性、盈利、成长和杠杆等十个因子。

更新时间：2023-06-01 14:28

能否通过AI分析优秀操盘手的交易数据，让AI具备操盘手的交易能力。

咨询各位大神一个问题，如果已有持续盈利操盘手的交易数据，是否可以通过AI对数据进行分析，让AI程序识别出操盘手下单的策略，让这个Ai具备操盘手相似的交易能力，然后用程序代替人工交易，减轻人工看盘和下单的工作量。

更新时间：2023-06-01 02:13

模拟交易数据标准化问题

问题

请问在模拟交易时，标准化是怎么做的，是每一天都重新把所有数据做一次标准化吗？

解答

你好，可以具体分享一下策略代码吗？我这边具体看看

如果是绑定实盘参数的数据，模拟交易是对每天的数据做标准化

以模版策略为例，如果要提交到模拟交易需要绑定实盘参数，这样策略每天都会以最新的日期来跑。

{w:100}{w:100}

更新时间：2023-06-01 02:13

一份用交易数据预测股票代码分享

ps：非本人代码，来自网络开源分享分享一篇，科赛网《〈公开新闻预测A股行业板块动向〉〉比赛第三名的开源方案：本次比赛使用的tushare免费数据，个人可以复现。

import datetime
import os
import sys
from multiprocessing.pool import Pool

import numpy as np
import pandas as pd
import talib
from loguru import logger
from sklearn.ensemble import RandomForestClassifier

更新时间：2022-11-20 03:34

人工智能系列二十五：真假序列识别再探，市场弱有效性检验与择时战场选择-华泰证券-20191117

摘要

尝试构建以真假序列识别为起点基于量价的主动投资研究框架

真假序列识别是检验市场有效性的有力工具。主动投资的核心是市场能否预测，如果市场无法预测，满足有效市场理论，主动投资就没有存在的价值。随机序列满足有效市场理论，无法预测。暂且抛开宏观、财务等数据，仅就交易数据看，如果人工智能算法无法识别真实量价序列和随机序列，那么弱有效市场假说可能成立；如果人工智能可以识别真假，那么可以进一步采用网络可视化技术挖掘模式，或采用遗传规划等算法来暴力挖掘特征。随后通过检验有效模式/特征、过拟合检验、风险控制等步骤，控制整体风险，实现完整的以真假序列识别为起点基于量价的主动投资研究流程。

更新时间：2021-11-26 07:30

分页第1页