数据挖掘

从金融视角来看,数据挖掘是一项强大的技术,它通过先进的算法对海量数据进行深度探索和分析,以揭示隐藏的模式、趋势和关联。在金融领域,数据挖掘的应用广泛且关键。它可以帮助金融机构更准确地评估风险、发现市场机会、优化投资策略,以及提升客户服务。例如,通过分析历史交易数据,可以预测股票市场的动态;通过挖掘消费者行为数据,可以个性化金融产品和服务。数据挖掘不仅能够提升金融决策的效率和准确性,还在金融科技的驱动下,不断推动金融行业的创新和发展。

10大统计技术

无论你如何看待数据科学这门学科,都不能轻易忽视数据的重要性,以及我们分析、组织和理解数据的能力。Glassdoor 网站收集了大量的雇主和员工的反馈数据,发现在美国“25个最好的工作职位清单”中排名第一的是数据科学家。尽管排名摆在那里,但毫无疑问,数据科学家们研究的具体工作内容仍会不断增加。随着机器学习等技术变得越来越普遍,像深度学习这样的新兴领域获得了来自研究人员、工程师以及各大公司更多的关注,数据科学家会继续站在创新浪潮之巅并且推动技术的不断发展。

尽管拥有强大的编码能力非常重要,但数据科学也并非全部都是关于软件工程的(事实上,能够熟练掌握python已经足够很好的开展工作了)。数据科学

更新时间:2024-06-12 05:51

AI量化策略,我该如何理解你?

人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。

理解机器学习算法

机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|

更新时间:2024-06-11 03:20

超参寻优调参顺序

策略案例


https://bigquant.com/experimentshare/fe8ec83484ca44148602d39a58545d75

\

更新时间:2024-06-07 10:55

因子构建


\

更新时间:2024-06-07 10:55

三因子加工

{{membership}}


https://bigquant.com/codeshare/a04ad103-6217-4484-a57c-81cc1e64fdf6

\

更新时间:2024-06-07 10:55

构建一个明日涨跌停状态因子

为什么要构建一个明日涨跌停状态因子?

构建明日涨跌停状态因子的目的是为了提升投资决策的效率和准确性,帮助投资者优化交易策略、管理风险、识别套利机会。此外,通过对涨跌停现象的研究,可以深入了解市场行为,为政策制定和市场监管提供有价值的参考。

如何构建?

要成功构建一个明日涨跌停状态因子,我们需要使用BigQuant数据平台中量化因子分类内股票因子中的cn_stock_prefactors(预计算因子的数据表)。根据需要构建因子的要求,我们需要使用收盘涨跌停状态: 1-跌停, 2-非涨跌停, 3-涨停, SQL 算子: cn_stock_status.price_limit_

更新时间:2024-06-07 10:55

用可视化的方式提取自己构造入库的因子

{{membership}}

https://bigquant.com/codeshare/323b5380-95d7-4410-a1ff-2116b3933d35

\

更新时间:2024-06-07 10:55

因子构建

9月24日Meetup 模板案例:

策略案例

https://bigquant.com/experimentshare/51adf36b114f4563b853329db07b3595

\

更新时间:2024-06-07 10:55

BigQuant平台策略构建流程

视频讲解

查看视频

策略源码

https://bigquant.com/codeshare/23bb6c6a-c4e3-4a7c-aed4-48c719c64dee

\

更新时间:2024-06-07 10:55

策略中调用其他因子_AI

策略案例

https://bigquant.com/experimentshare/5cfd9186208047518a995e4394ba1099

\

更新时间:2024-05-21 08:15

lightgbm多因子选股

旧版声明

本文为旧版实现,仅供学习参考。

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU


预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors

https://bigquant.com/wiki/doc/dai-PLSbc1SbZX

[ht

更新时间:2024-05-20 06:21

【历史文档】策略示例-基于StockRanker的AI量化选股策略

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-16 01:59

【历史文档】策略-回测研究

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 10:04

【历史文档】因子构建与标注样例-Alpha因子构建及因子测试

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间:2024-05-15 06:37

WorldQuant Alpha101因子 附录三:所有因子的SQL实现

https://bigquant.com/codeshare/4515d40b-c2f4-4439-a2c9-92931adb0c6d

\

更新时间:2023-08-21 10:56

BigQuant 最佳实践

  • BigQuant使用案例
  • 最佳使用方式

\

更新时间:2023-06-29 06:56

【量化研究】高频时间尺度的相关性结构

这是一篇简单探讨高频时间尺度的相关性结构的paper。

![](/community/uploads/default/original/3X/6/9/69f10a5b74c09f78e4a141b864313500f

更新时间:2023-06-14 03:02

NLP系列学习:文本聚类

最近一段时间在文本聚类的工作,一路也遇到了不少坑,自己也写一篇文章记录了一下自己的过程.

1:什么是文本聚类

先说说聚类的概念,聚类又称群分析,是数据挖掘的一种重要的思想,聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。(以上来自百度百科).

再说到文本聚类,文本聚类其实也就是在文本方向上的应用,首先我们要把一个个文档的自然语言转换成数学信息,这样形成高维空间点之后再去计算点与点之间的距离,然后将这些距离

更新时间:2023-06-14 03:02

论如何优雅地复制期权之OBPI策略

在机器学习、数据挖掘大行其道的今天,我再在这里给大家分享六、七年前股指期货刚推出时国内比较火爆的策略似乎是比较LOWBEE的一件事,一开始我也是拒绝的,但是拒绝并不代表拒绝成功,正如我抗议,抗议无效一样。如果把机器学习比作阳春白雪,我这种只能称为下里巴人了。但能够玩转阳春白雪的人毕竟是少数,所以让我们继续沿着革命的道路前进。不过想到上次ARMA+GARCH交易策略在沪深300指数上的运用这篇文章铩羽而归,内心其实是有点小忐忑的,会不会再一次折戟沉沙,毕竟大家喜欢,才能体现科普文章的价值。

在正式介绍OBPI(O

更新时间:2023-06-14 03:02

《Ranking Relevance in Yahoo Search》(下)

SEMANTIC MATCHING FEATURES

接下来这部分可以说是搜索引擎中最为重要的部分了,包含了基础语义特征以及点击反馈。

Click Similarity

(点击是搜索引擎中用户反馈最为重要的一个信号,通过点击可以挖掘出极其丰富的数据。)这里是通过点击来构建query和url之间的桥梁。将全量的query和全量的url看作一个庞大的clickgraph,query和url是节点,若是q-u之间存在点击,则有一条边将两者相连,点击次数是这条边的权重。(有节点,有边,有权重,完美~)

从两个不同的url共现的query(即clickquery)中提取出

更新时间:2023-06-14 03:02

【Alpha-Nebula】基于社交网络的股票预测研究

欢迎大家持续关注我们的专栏Alpha-Nebula,我们会持续分享高质量的量化相关内容。这篇文章我们介绍的是一篇叫做**“Study of Stock Prediction Based on Social Network”**的Paper,作者针对市场,爬去了新浪微博和股吧的数据进行了一些有趣的研究。

Social Behavior Graph

作者爬完了这两个社交平台的数据之后,通过Hamming Distance和时间间隔来辨别不同帖子之间的similarity:即如果Hamming Distance小于2,同时两个贴的时间间隔小于1小时,那么就认为这两个贴是可以

更新时间:2023-06-14 03:02

你以为是噪声的残差,他们却这般玩出了花

投资“常识”:残差项是噪声,离得越远越好

近50年前,Fama提出石破天惊的有效市场假说(EMH),市场有效这一理念随之深入人心。典型的资产定价模型(例如CAPM和Fama-French三因子模型)指出,一项资产或投资组合的收益由以下三个部分构成:

  • 承担系统性风险获得的补偿(beta);
  • 卓越的超额收益,特别是选股能力(alpha);
  • 不可分散的异质性风险(均值为0,与系统性风险无关,且不同资产的异质性风险也相互无关)。

换言之,一项资产的收益,由系统性风险补偿,资产超额收益和随机残差项组成。无论从统计的角度,还是从金融逻辑的角度,随机残差部分都不包含任何有意义

更新时间:2023-06-14 03:02

干货| Visenze企业级视觉产品与应用(附PPT和音频链接)

--------------------------------------------------------------------------------------------

欢迎关注知乎专栏:

卷积神经网络(CNN)入门讲解​zhuanlan.zhihu.com 图标

-------------------

更新时间:2023-06-14 03:02

基于卷积神经网络模型的市场择时策略-华西证券-20220828

摘要

量化择时交易策略

深度学习量化交易策略是从海量历史数据中利用统计原理通过数据挖掘和逻辑验证的方式发掘出超额收益来源。相比于传统的线性模型,深度学习模型的表示能力更强,能够学习的特征更多。本文以卷积神经网络为例,介绍深度学习模型在量化择时模型中的应用。

卷积神经网络感受野更宽,非线性表达能力更强,在收益率分类的场景下表现突出

卷积神经网络是一种常用的机器学习模型,相比于传统的全连接神经网络,卷积神经网络通过卷积层和池化层的结构,使得输出的感受野更宽,同时卷积核的权值是共享的,从而有效减少参数数量,卷积神经网络通过卷积层、池化层、全连接层不同块的组合结构设计,使

更新时间:2023-06-13 06:53

数据挖掘视角下的因子轮动初探-长江证券-20180609

摘要

数据挖掘因子轮动关系有自身的局限性和优越性

数据挖掘探究因子轮动,可以利用模型的优势找到更为精细的关系。由于因子轮动的数据量较小,容易过拟合,且逻辑层面较难给出解释。通过扩充数据量及分类模型的应用,降低信噪比和过拟合程度;通过抽取简单模型窥视变量和因子轮动的逻辑关系。

外生变量和因子有效区间有较大关系

根据市场环境变量和随机森林模型建立的因子择时策略相比于默认因子方向建立的策略,除动量因子外,均有提高。以因子择时为基础建立的多因子等权配置策略年化收益为4.76%,最大回撤1.17%,信息比5.11,Calmar比4.06。从树的结构来看,和因子是否有效最相关

更新时间:2023-06-01 14:28

分页第1页第2页第3页
{link}