无论你如何看待数据科学这门学科,都不能轻易忽视数据的重要性,以及我们分析、组织和理解数据的能力。Glassdoor 网站收集了大量的雇主和员工的反馈数据,发现在美国“25个最好的工作职位清单”中排名第一的是数据科学家。尽管排名摆在那里,但毫无疑问,数据科学家们研究的具体工作内容仍会不断增加。随着机器学习等技术变得越来越普遍,像深度学习这样的新兴领域获得了来自研究人员、工程师以及各大公司更多的关注,数据科学家会继续站在创新浪潮之巅并且推动技术的不断发展。
尽管拥有强大的编码能力非常重要,但数据科学也并非全部都是关于软件工程的(事实上,能够熟练掌握python已经足够很好的开展工作了)。数据科学
更新时间:2024-06-12 05:51
人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。
机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y$未来的取值,并找到了影响变量$ Y$取值的$K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数$f(X_1,X_2,\ldots,X_K|
更新时间:2024-06-11 03:20
更新时间:2024-06-07 10:55
\
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
构建明日涨跌停状态因子的目的是为了提升投资决策的效率和准确性,帮助投资者优化交易策略、管理风险、识别套利机会。此外,通过对涨跌停现象的研究,可以深入了解市场行为,为政策制定和市场监管提供有价值的参考。
要成功构建一个明日涨跌停状态因子,我们需要使用BigQuant数据平台中量化因子分类内股票因子中的cn_stock_prefactors(预计算因子的数据表)。根据需要构建因子的要求,我们需要使用收盘涨跌停状态: 1-跌停, 2-非涨跌停, 3-涨停, SQL 算子: cn_stock_status.price_limit_
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
更新时间:2024-06-07 10:55
更新时间:2024-05-21 08:15
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors
https://bigquant.com/wiki/doc/dai-PLSbc1SbZX
[ht
更新时间:2024-05-20 06:21
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-16 01:59
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 10:04
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 06:37
更新时间:2023-08-21 10:56
\
更新时间:2023-06-29 06:56
这是一篇简单探讨高频时间尺度的相关性结构的paper。
![](/community/uploads/default/original/3X/6/9/69f10a5b74c09f78e4a141b864313500f
更新时间:2023-06-14 03:02
最近一段时间在文本聚类的工作,一路也遇到了不少坑,自己也写一篇文章记录了一下自己的过程.
1:什么是文本聚类
先说说聚类的概念,聚类又称群分析,是数据挖掘的一种重要的思想,聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。(以上来自百度百科).
再说到文本聚类,文本聚类其实也就是在文本方向上的应用,首先我们要把一个个文档的自然语言转换成数学信息,这样形成高维空间点之后再去计算点与点之间的距离,然后将这些距离
更新时间:2023-06-14 03:02
在机器学习、数据挖掘大行其道的今天,我再在这里给大家分享六、七年前股指期货刚推出时国内比较火爆的策略似乎是比较LOWBEE的一件事,一开始我也是拒绝的,但是拒绝并不代表拒绝成功,正如我抗议,抗议无效一样。如果把机器学习比作阳春白雪,我这种只能称为下里巴人了。但能够玩转阳春白雪的人毕竟是少数,所以让我们继续沿着革命的道路前进。不过想到上次ARMA+GARCH交易策略在沪深300指数上的运用这篇文章铩羽而归,内心其实是有点小忐忑的,会不会再一次折戟沉沙,毕竟大家喜欢,才能体现科普文章的价值。
在正式介绍OBPI(O
更新时间:2023-06-14 03:02
接下来这部分可以说是搜索引擎中最为重要的部分了,包含了基础语义特征以及点击反馈。
Click Similarity
(点击是搜索引擎中用户反馈最为重要的一个信号,通过点击可以挖掘出极其丰富的数据。)这里是通过点击来构建query和url之间的桥梁。将全量的query和全量的url看作一个庞大的clickgraph,query和url是节点,若是q-u之间存在点击,则有一条边将两者相连,点击次数是这条边的权重。(有节点,有边,有权重,完美~)
从两个不同的url共现的query(即clickquery)中提取出
更新时间:2023-06-14 03:02
欢迎大家持续关注我们的专栏Alpha-Nebula,我们会持续分享高质量的量化相关内容。这篇文章我们介绍的是一篇叫做**“Study of Stock Prediction Based on Social Network”**的Paper,作者针对市场,爬去了新浪微博和股吧的数据进行了一些有趣的研究。
作者爬完了这两个社交平台的数据之后,通过Hamming Distance和时间间隔来辨别不同帖子之间的similarity:即如果Hamming Distance小于2,同时两个贴的时间间隔小于1小时,那么就认为这两个贴是可以
更新时间:2023-06-14 03:02
近50年前,Fama提出石破天惊的有效市场假说(EMH),市场有效这一理念随之深入人心。典型的资产定价模型(例如CAPM和Fama-French三因子模型)指出,一项资产或投资组合的收益由以下三个部分构成:
换言之,一项资产的收益,由系统性风险补偿,资产超额收益和随机残差项组成。无论从统计的角度,还是从金融逻辑的角度,随机残差部分都不包含任何有意义
更新时间:2023-06-14 03:02
--------------------------------------------------------------------------------------------
欢迎关注知乎专栏:
卷积神经网络(CNN)入门讲解zhuanlan.zhihu.com
-------------------
更新时间:2023-06-14 03:02
深度学习量化交易策略是从海量历史数据中利用统计原理通过数据挖掘和逻辑验证的方式发掘出超额收益来源。相比于传统的线性模型,深度学习模型的表示能力更强,能够学习的特征更多。本文以卷积神经网络为例,介绍深度学习模型在量化择时模型中的应用。
卷积神经网络是一种常用的机器学习模型,相比于传统的全连接神经网络,卷积神经网络通过卷积层和池化层的结构,使得输出的感受野更宽,同时卷积核的权值是共享的,从而有效减少参数数量,卷积神经网络通过卷积层、池化层、全连接层不同块的组合结构设计,使
更新时间:2023-06-13 06:53
数据挖掘因子轮动关系有自身的局限性和优越性
数据挖掘探究因子轮动,可以利用模型的优势找到更为精细的关系。由于因子轮动的数据量较小,容易过拟合,且逻辑层面较难给出解释。通过扩充数据量及分类模型的应用,降低信噪比和过拟合程度;通过抽取简单模型窥视变量和因子轮动的逻辑关系。
外生变量和因子有效区间有较大关系
根据市场环境变量和随机森林模型建立的因子择时策略相比于默认因子方向建立的策略,除动量因子外,均有提高。以因子择时为基础建立的多因子等权配置策略年化收益为4.76%,最大回撤1.17%,信息比5.11,Calmar比4.06。从树的结构来看,和因子是否有效最相关
更新时间:2023-06-01 14:28