欢迎大家持续关注我们的专栏Alpha-Nebula,我们会持续分享高质量的量化相关内容。这篇文章我们介绍的是一篇叫做**“Study of Stock Prediction Based on Social Network”**的Paper,作者针对市场,爬去了新浪微博和股吧的数据进行了一些有趣的研究。
作者爬完了这两个社交平台的数据之后,通过Hamming Distance和时间间隔来辨别不同帖子之间的similarity:即如果Hamming Distance小于2,同时两个贴的时间间隔小于1小时,那么就认为这两个贴是可以
更新时间:2023-06-14 03:02
最近加入了知乎上之前发起的一个量化学术小组ALPHA-NEBULA,结合自身的专业特长,有选择性的看了几篇论文,也获得了一点启发,在这里做个记录和分享。
这次主要依据Market turning points forecasting using wavelet analysis这一篇论文进行分享。
文章结构大致分为以下几个部分。
一、频域分析理论背景
首先,我们都知道,金融市场具有周期性,最简单的例子就是,将股票市场时间尺度拉大了看,可以看到是一个不那么完美的正弦波。事实上我们可以简单的认为
更新时间:2023-06-14 03:02
**赫斯特指数和分数布朗运动大概是在国内量化投资界被使用(和被滥用)的最广泛的分析手段。**它们被提出的历史进程如下。
1951 年,英国水文学家赫斯特(Harold Edwin Hurst)在研究尼罗河水位变化时发现了时间序列中存在的长记忆性(long-term memory, Hurst 1951),即时间序列当前(或过去)的取值以远超随机扰动所能达到的程度影响该时间序列在未来的取值。进一步的,他发现该长记忆性存在于更广泛的自然现象中,比如降雨量、树的年轮,太阳耀斑等。为了纪念他的发现,后人使用**赫斯特指数(Hurst expone
更新时间:2023-06-14 03:02
当模型复杂度一样时,人们偏好风险收益特性更高的策略;当风险收益特性一样时,人们偏好模型复杂度更低的策略。各种复杂模型带来的边际超额收益能否 justify 它们的复杂度呢?拭目以待。
一个初入量化投资的分析师经过了一个月的奋斗开发出了一个双均线趋势追踪模型后,兴冲冲的跑来和他的基金经理汇报,于是便有了下面这段对话。
更新时间:2023-06-14 03:02
\
从IC、IR到另类线性归因
基于IC、IR的单因子分析是传统多因子分析的基石。但是IC、IR分析出却不能考虑到多因子模型中因子与因子之间的相互影响。因此我们以之前报告介绍的标准神经网络回归为例,用另类线性归因对因子进行了分析。
从线性归因到非线性归因
所有线性归因都是基于因子单调性(线性)的强假设。但是在机器学习的非线性世界中,这个强假设不复存在。非线性的机器学习算法需要非线性的归因方式。
从相关性到因果性
所有的传统归因方式都是基于相关性的而非因果性。因果分析也是机器学习未来的一个重点。我们以TMLE为例介绍机器学习下的因果性分析。
更新时间:2023-06-14 03:02
\
更新时间:2023-06-14 03:02
我从上世纪80年代就开始从事专业投资,目前的环境在很多方面肯定是与众不同的。像我们几十年来从未见过的流行病、史无前例的全球政策反应、经济活动的急剧下降导致对资产价格的巨大影响,这些都使这种环境与众不同。这就是说,我非常相信“历史不会重演,但总是惊人的相似”。这意味着我们可以回顾过去,看到有用的经验教训,如何最好地驾驭这种环境,并继续为我们的客户生产风险调整阿尔法。作为一家量化公司,产生阿尔法是我们所做一切的驱动力——根据过去的关系,建立预测未来回报的量化框架。
我相信,在当前形势下,有几点经验可以借鉴:
1. 坚持流程
2. 适应环境
3. 管理风险
听起来像母亲和苹果派,很难
更新时间:2023-06-14 03:02
摩根士丹利在近期研报中表示,和 10-15 年前相比,如今更严的监管以及激烈的竞争,令很多流行的量化投资策略不再有效,导致量化投资超额收益锐减,整个行业如今已走到十字路口。
传统策略不再凑效
摩根士丹利称,各类股票型对冲基金指数的超额收益全面下滑,自 2008 年来,剔除费用之后的基本面和量化股票指数的超额收益都已经接近于零。
而对于那些在2000年前仍有超额收益的指数来说,随着同一年美国证监会加强上市公司信息披露监管的Regulation FD (Reg FD)条例出台,他们的表现也在持续下滑。
为何会出现这种情况?
报告表示,对于传统的量化指标来说,不管是估值指标还是动量指标,
更新时间:2023-06-14 03:02
程序化交易与量化投资的区别
程序化交易是什么?量化投资又是什么?事实上,我们中的绝大部分人并没有尝试了解程序化交易和量化投资的正确概念,而是笼统地将两者画了等号。更多所谓的评论者则直接把高频交易与低延时交易混为一谈,指鹿为马,误导公众舆论行吸睛之实。
在最早期纽约证券交易所(NYSE)的定义中,程序化交易是指包含15只股票以上、成交额在100万美元以上的一篮子交易,2013年8月NYSE取消了定义中总价值100万美元以上的条件。在后来的市场实践中,程序化交易的对象扩大到各个交易所上市的股票、期货、期权等,是由电脑直接发出下单指令并自动执行的。
随着金融衍生品的不断丰富,程序化交易
更新时间:2023-06-14 03:02
\
更新时间:2023-06-14 03:02
近期市场的波动格外引人注目,有俄乌战争的影响,也有青山事件的持续发酵,黑天鹅和灰犀牛都不约而至。不过今天要讲的,并不是这些国际事件,而是近两年火热的雪球产品,据说雪球产品对于经济市场的影响,也是不容小觑。
2022年3月11日,业内人士聊天截图称:“雪球爆炸,我公司与恒生科技指数挂钩的雪球,今年一天的敲入量超过了之前历史的总和。”结合此前,2022年3月9日晚间,有消息称挂钩中证500的雪球产品集中抛出期指持仓致使下跌,这个聊天截图瞬间传遍了各大社交APP,这一波,真是雪球惹的祸吗?雪球产品的雪崩,对量化行情有没有冲击呢?
图片
图源:来自社交APP
此文并不代表任何投资观点,亦不构成
更新时间:2023-06-14 03:02
算法交易顾名思义就是采用某些算法让计算机自动进行交易决策、下单以及订单资金管理等一系列操作。算法交易系统和一个基于事件的回测系统组成非常相似,这一点在搭建回测系统系列文章中有所提及。一般来讲,算法交易系统由数据模块、模型模块、执行模块以及算法监测模块这几大部分组成。
数据模块包含结构化和非结构化两部分的数据。结构化的数据一般包含品种的交易数据以及公司的金融数据;非结构化数据则包括新闻、社交网站等文本数据,这些数据需要一些专门的文本分析挖掘工具来进行处理。
应用于算法交易的模型主要有这样几类。一类是数学统计类模型,这类模型通常采用概率论的方法去度量风险因子、用
更新时间:2023-06-14 03:02
**编者按:**人生之三境界的第一层,“看山是山,看水是水”,本质上展示了人“看见”的过程,以及思绪与理解在这一过程中所起的作用。
“看见”,对于人类而言,似乎是一个很简单自然的事情,其实则不然,从地球上第一个长出眼睛的生物三叶虫,走到今天的人类视觉,经历了五亿四千万年的漫长旅程。人类获得今天的视觉能力,是大自然长期进化的结果,大脑中三分之一的皮层是与视觉相关的。
因此人的视觉任务,本质上是人脑对外界视觉信号作出反应的过程,那么,研究人脑的工作机理,是否能够为计算机视觉提供一些启发,让机器“看山是山”呢?基于此,学术界开展了脑启发视觉计算领域的研究。那么过去一年中,在这一领域都取得
更新时间:2023-06-14 03:02
**量化投资与机器学习与DigQuant点宽网**开展了一次学术合作
**[本期是概率分布图系列(一)](https://link.zhihu.com/?target=https%3A//mp.weixin.qq.com/s%3F__biz%3DMzUxODEyNDI1Mw%253D%253D%26mid%3D2247484131%26idx%3D1%26sn%3Db7912719473ad6ac43ffb2853493514e%26scene%3D45%
更新时间:2023-06-14 03:02
Fama-French三因子模型是量化领域最经典的模型之一,该模型的提出是在论文《commom risk factors in returns on bonds and stocks》里,本文本着学习的精神对其进行了复现,并使用论文中的方法在中国A股市场上进行了实证。点击查看原文链接
三因子模型公式如下:
![](/community/uploads/default/original/3X/f/1/f110ddfae681398e1582802f5461cc92
更新时间:2023-06-14 03:02
原文章来自元盛Winton网站,本文为原文章的中文翻译。本文仅用于交流学习使用,不得用于商业用途。如对相关著作人造成侵害,请立即联系译者及时删除。
原文标题:Winton Capital's Idiosyncratic Founder on Artificial Intelligence and Statistical Fallacies
原文时间:2018年12月
翻译:雷闻
伦敦的哈默史密斯街是英格兰最后一个你可能期望找到对冲基金经理的地方之一。这是一条绿树成荫的住宅街,位于伦敦西部一个不那么时髦的地方。
元盛资本(Winton Capital)的创始人大卫·
更新时间:2023-06-14 03:02
伦敦的哈默史密斯街是英格兰最后一个你可能期望找到对冲基金经理的地方之一。这是一条绿树成荫的住宅街,位于伦敦西部一个不那么时髦的地方。
元盛资本(Winton Capital)的创始人大卫·W·哈丁(David Harding)坐在一间简陋的办公室里,远离伦敦著名的梅菲尔区(Mayfair)庄严的米色市政厅。正如康涅狄格州的格林威治被称为美国对冲基金的中心,梅菲尔也是面向超级富豪和机构的投资池的所在地。
元盛资本在1997年成立时只有160万美元的资产,几十年前在欧洲成为商品交易顾问,简称CTA,是一种通过跟踪各种商品、货币、债券和股票市场趋势进行交易的投资工具。
从那时起,元盛已演变成一
更新时间:2023-06-14 03:02
知乎上关于隐马尔科夫模型的科普非常详细了。可以直接参考这个问题下面大神们的回答。
中文互联网上关于隐马模型在股票上的应用,基本都直接或间接引用了广发证券的2010年的一篇照理不应该公开的报告。知乎上面的就有:
陈小米 的 [【研究】西蒙斯的赚钱秘籍:隐马尔科夫模型(HMM)的择时应用 - 神秘的宽客们 - 知乎专栏](https://zhuanlan.zhihu.
更新时间:2023-06-14 03:02
报告《市场微观结构系列(2):高频视角下的微观流动性与波动性》中,我们利用tick级别的价量数据构造了描述股票交易微观结构、微观流动性、微观波动率的指标,并对市场的微观特征及近期发生的变化进行了分析。本篇报告则回到量化投资的框架中,探究股票微观特征因子在各类量化模型中应用的有效性。
因子测试:推荐关注集合竞价成交量占比因子和微观流动性因子
更新时间:2023-06-14 03:02
文本挖掘作为数据挖掘的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页中的论坛、微博、新闻等。文本挖掘是目前金融量化研究的一个非常热门的领域,其主要原因有以下三点:
更新时间:2023-06-14 03:02
导读: 量化投资经过几十年的发展,在全球资本市场动荡不定,规律难循的背景下,被证明是最好的投资方法之一,已逐步成为全球金融机构的主流投资方法,但在中国量化投资还是一种新兴技术,处于萌芽和发展阶段。在云计算环境下,新的信息技术的应用将会给我国的资本市场带来新的机会,并形成新的产业形态。然而,云计算技术在证券行业的应用已经得到广泛的认可,在行业监管机构、核心机构的推动下,证券云平台基础设施逐渐完善,基于云服务的交易所接入规范、应用开发规范正在制定中。随着行业中金融衍生品的不断推出,相信量化投资云服务将成为投资领域不可或缺的重要工具和服务手段。
随着中国期货公司、资产管理公司牌照的发放,国
更新时间:2023-06-14 03:02
谈起量化投资之中最为著名的模型,除了CAPM,可能就是Fama和French的三因子模型了。大名鼎鼎的CAPM模型在Markowitz和Sharpe的努力下构建出理论模型后,许多大牛都对其进行过实证检验,包括诺奖得主Scholes、Merton和Fama,这些针对于上世纪70年代以前数据的分析证明CAPM的有效性,但是在70到80年代的研究中,人们却发现股票收益不能被市场贝塔很好地解释,市场异象频生,这意味着,我们还需要用其他的方式来寻找新的因素来分析股票收益的变动。
1992年Fama和French采取横截面回归的方法,研究市场贝塔、账面市值比(下文简称帐市比)、市值、市盈率以及财务杠杆对
更新时间:2023-06-14 03:02
近些年,量化投资在国内开始了飞速发展的进程。数据显示,今年以来量化基金业绩表现相对稳定,尤其是二季度以来,近八成量化基金今年以来的回报跑赢大盘,受到市场追捧。
震荡市场下还能取得如此靓丽业绩,再次让投资者关注量化投资的重要性。各基金公司也纷纷开始投入大量人力、物力,在量化领域谋篇布局。
天时、地利兼备,而“人和”就成了各家公募基金角力之点。量化投资战国来临,棋局暗流涌动, “将”、”帅“、”车“、”炮“各归其位。优秀的人才,成了业内兵家必争之所在。
值得注意的是,在众多公募基金中,国金基金是第一家提出“量化运营中心平台+事业部 “制度的基金公司,开行业风气先河。作为60后基金公司,国金基
更新时间:2023-06-14 03:02
1、什么是量化选股?
每个投资者在投资生活中有着这样或那样的选股原因,有的着重看财务指标,比如只买PB小于2的股票,有的则喜欢依赖于技术分析,喜欢买入近12个月跌幅超过一定幅度的股票。量化选股并不神秘,它只是把您心中那个心照不宣的原因给标准化、在每个周期按照机械化的流程选出股票而已。
就像Pascal语言之父N.Wirth提出的“程序=数据结构+算法”,实际上,量化选股的本质=因子+算法,因子就是你觉得影响股价变动的一个或多个原因;
更新时间:2023-06-14 03:02
乖离率指标(Bias):
所需数据和参数:Bias(close,nDay,threshold )
指标伪码:
MAVAL:=MA(CLOSE,nDay);
BIAS:=100*(CLOSE-MAVAL)/MAVAL;
/wiki/static/upload/21/210c8875-0828-4472-a65c-1ee21ec1bfec.pdf
\
更新时间:2023-06-13 06:53