数据处理

数据处理在金融领域中占据核心地位,它是将原始数据转化为有价值信息的关键环节。在金融行业,数据不仅是数字的简单堆砌,更是一种洞察力和决策依据的来源。有效的数据处理能够揭示市场趋势、评估投资风险、优化资产配置、提升交易策略,并加强风险管理。在大数据时代,金融机构不仅需要收集和存储海量的数据,更需要通过高级算法和强大的计算能力对这些数据进行清洗、整合、分析和解释。数据处理技术的进步,如人工智能和机器学习,使得金融企业能够更准确地预测未来市场动向,为客户提供个性化服务,以及自动化和优化内部运营。因此,对于金融行业来说,掌握先进的数据处理技术并将其应用于实践,是保持竞争优势和实现持续增长的关键。

如何单独计算和查看一个因子特征数据(视频教程+代码)

问题

想要单独计算和查看一个因子特征数据,比如 `sum(avg_turn_10 > 0.05, 20)`,应该怎么做?

视频教程

/wiki/static/upload/b1/b12c2ca5-40ca-4e7c-bf51-6f96a844080f.mp4

\

实现步骤

  1. 我的策略 > 新建 > 可视化策略

  2. 只保留如下四个模块,删除其余模块


    ![{w:100}{w:100}{w:100}](/wik

更新时间:2023-06-01 14:26

怎么求N日内收盘价的最低值

没有找到类似的函数,类似的就一个mean求平均值,为什么没有函数文档啊?

更新时间:2023-06-01 14:26

找不到依赖的列:close_0avg_turn_0

问题

找不到依赖的列:close_0avg_turn_0

选择换手率因子,是为了找流动性较好的股票,股性较为活跃。 选取资金流超大单因子,是为了增加短期买点的爆发力。 因为超大单因子的ic均值很高,而且存在一定的方向性,在牛市中有较为稳健的风格收益。

怎么解决呀!少了那个定义呀

https://bigquant.com/experimentshare/c73ca37a718648c7ac0951e25dee42fa

![{w:100

更新时间:2023-06-01 14:26

请教一个因子收益价格的问题

问题

如下图,请教一下各位大佬,因子分析里面的收益价格,在因子分析的时候是取当天的还是第二天的?

看了alphalens的介绍,这里应该要取第二天的数据,不知道平台的因子分析里面有做了处理没有

策略

{w:100}{w:100}

\

更新时间:2023-06-01 14:26

因子分析模块中,如何设定参与因子分析的股票数量

问题

因子分析模块中,如何设定参与因子分析的股票数量

更新时间:2023-06-01 14:26

怎样获取close_250因子

问题

基础因子只有close0 ---close_120,

使用 shift(close0 ,250),

显示如下,

{w:100}

Q:

怎样获取close_250因子

\

更新时间:2023-06-01 14:26

模拟交易报错:no data left after dropnan

{w:100}请知道原因的老师指导一下,谢谢

更新时间:2023-06-01 02:13

ValueError: cannot reindex from a duplicate axis

问题

问题描述

<ValueError: cannot reindex from a duplicate axis>,如何解决

问题截图

{w:100}{w:100} {w:100}{w:100}

更新时间:2023-06-01 02:13

BigQuant平台如何处理策略回测中幸存者偏差问题的?

问题

在量化投资中,经常犯的错误有未来函数、过度拟合、偷价漏价、幸存者偏差等,我想知道BigQuant平台是如何处理幸存者偏差这个问题的?

更新时间:2023-06-01 02:13

ZScoreNorm标准化后输出全为空值?

问题

问题描述

ZScoreNorm标准化后输出全为空值?

问题策略

https://bigquant.com/experimentshare/e91b4eed4f534753a3692800f33a4737

\

更新时间:2023-06-01 02:13

数据过滤报错

问题

pandas.core.computation.ops.UndefinedVariableError: name ‘close_0’ is not defined

解答

是没有list_days_0这个因子吗?

更新时间:2023-06-01 02:13

如何用data. history读取基金数据

问题

请问怎么用data. history读取基金数据?我在文档找到context. future_symbol context. symbols 但是没有看到基金。

\

解答

问:已经用DataSource读取了基金数据,后面只需要轮动使用其中部分数据,这个要怎么使用?需要获取基金数据的时间窗口,应该怎么弄?


答:回测里面也可以用DataSource读取相关数据,时间窗口用 start_date 和 end_date 确定。如果不想在回测内部里用 DataSource,可以把外面读取到 DataFrame 传给回测模块,然后进行 DataFrame的切片操作。

\

更新时间:2023-06-01 02:13

数据处理函数里的分组是怎么实现的

问题

{w:100}

解答

按日期分组,实际上就是groupby(‘date’) 然后对每天的数据进行一个处理。

更新时间:2023-06-01 02:13

这种情况如何标准化数据?

我尝试构建一个模板,左边的输入特征是用来过滤股票的,右边的输入特征是准备用来使用stockranker进行优化的指标。通过连接数据模块M12实现了数据过滤的股票代码和右边的输入特征的连接,但是如果需要进一步对数据j进行标准化如何处理?尝试用M13模块标准化,发现M13和M12模块导出的结果是一样的并没有标准化。谢谢各位老师和大神!

[https://bigquant.com/experimentshare/72612668e0bb439c961f2be0de113e22](https://bigquant.com/experimentshare/72612668e0bb439c961f2be

更新时间:2023-06-01 02:13

KeyError: 'datetime'

问题

问题描述

<KeyError: 'datetime'>,如何解决

问题截图

{w:100}{w:100}{w:100}

{w:100}{w:100}{w:100}

\

更新时间:2023-06-01 02:13

滚动训练报错NaTType does not support

问题

滚动训练报错NaTType does not support

https://bigquant.com/experimentshare/3ca7d2657bbb411b9a0f4c908d3a99a0

\

更新时间:2023-06-01 02:13

有无办法将回测结果的每日收益率写入csv

问题

有无办法将回测结果的每日收益率写入csv

解答

df = m19.raw_perf.read_df() df['algo_dailyret'] = (df['algorithm_period_return']+1).pct_change().fillna(0).to_frame()

更新时间:2023-06-01 02:13

中性化处理报错

问题

在运行中性化处理时,报错:

'date' is both an index level and a column label, which is ambiguous

\

策略

https://bigquant.com/experimentshare/e5458d96906e43e6a30a1254e5d52639

解答

这个模块是用户封装的,可以右键”生成自定义模块“,然后查看代码:



![{w:100}

更新时间:2023-06-01 02:13

提问-数据处理报错问题

  • [ ] 请平台的工程师帮看一下下面链接的数据处理报错问题,如何修改,谢谢

https://bigquant.com/experimentshare/a0b651e11aeb4efcaa754a10ea923941

\

更新时间:2023-06-01 02:13

获取到的数据连接重复的疑问

https://bigquant.com/experimentshare/3399e83df2ea49e4ae1378ed0c9378db

\

更新时间:2023-01-11 05:55

如何以不复权或者前复权数据获取

问题

如何以不复权或者前复权数据获取,用后复权我有一套指标价格完全不对了,导致没法使用

\

更新时间:2022-12-20 14:20

训练时报数据错误,但数据有115478 行,应该是够的呢

https://bigquant.com/experimentshare/711ca5b92c11435ead022cd39c287f17

\

更新时间:2022-12-20 14:20

多因子分析模块的疑问

请教一下bq的工程师:多因子分析模块里面的回测功能是如何实现的,我自己实现的和模块的结果不一样,导致分析模块很好的因子,回测下来效果却不好,能否给讲讲实现原理啥的。

更新时间:2022-11-09 01:23

宏观经济数据chibor_3W无法在特征列表找到

{w:100} {w:100}

更新时间:2022-11-09 01:23

CTA 策略系列报告:商品量化基本面研究框架的探索之铁矿石

摘要

我们梳理了铁矿石的产业链逻辑,将影响铁矿石价格的因子分为两大类四子类,基本面因子包括供应因子、需求因子、库存因子,而情绪因子是并列于基本面因子的一大类因子。

基本面因子相对于行情数据有更新频率更低、更新不够及时、统计口径时有变化等特点,所以数据处理方面有其特殊之处,本文从数据频率的统一、数据及时性、季节性调整以及奇异值的处理等方面进行了深入探讨。

对于单个因子来说,为了衡量其预测效果,我们采用三分位法作为信号生成机制,确定未来的交易头寸,从中发现三分位法的t统计量的值与我们通常追求的夏普比率(不考虑手续费和交易摩擦)相关性非常高,可达到98%以上,这一点与螺纹钢的结果一致。从

更新时间:2022-09-01 13:59

分页第1页第2页第3页第4页第5页
{link}