机器学习

机器学习在金融领域的应用日益广泛,为金融业务的智能化提供了强大动力。它运用算法和模型,自动从海量数据中学习和提取有用信息,无需人工进行复杂编程。在金融风控方面,机器学习技术可帮助银行、保险公司等机构更准确地识别欺诈行为,降低信贷风险。在投资策略上,通过对历史数据的深度学习,机器能预测市场走势,为投资者提供更精准的建议。同时,机器学习还能优化客户服务,例如通过聊天机器人提供24小时在线咨询,或根据客户行为数据提供个性化金融产品推荐。总的来说,机器学习不仅提升了金融业的效率和智能化水平,也在重塑我们的金融生态。

机器学习论文笔记(五):Squeeze-and-Excitation Networks

机器学习论文笔记(五):Squeeze-and-Excitation Networks

arxiv:https://arxiv.org/abs/1709.01507

代码地址:https://github.com/hujie-frank/SENet

PyTorch代码地址:[https://github.com/miraclewkf/SENet-PyTorch](https://zhuanlan.zh

更新时间:2023-06-14 03:02

机器学习在量化投资中的应用:从技术分析谈起

前言:

最近特别忙,写毕业论文,找工作,忙得不亦乐乎。硕士两年来做的一些工作,导师没有让我往毕业论文里面写,我感觉到,这两年的一些经验以及所思所想,可能没有办法写成正式的文章了,特别可惜。所以我决定把自己的一些思考拿出来与大家分享。我从来没有将机器学习应用在量化投资的实战经验(其实我神马实战经验也没有。。),但是读过相当数量的相关论文。很多论文,如许多网友所喷,“这玩意儿根本不work”。说实话,我也知道这些论文不work。但是“不work”并不代表“没用”。一篇文章里,能有一个闪光的思想,对真实投资有一些借鉴价值,我觉得这篇文章就是“有用”的。而所谓的“不work”,是指把这篇文章

更新时间:2023-06-14 03:02

量化投资灵魂18问

背景

近期对于量化争议颇多,无论市场涨跌量化都会被拉出来分析一番,量化是否对影响到了市场的变化?大众理解的量化和实际的量化是否一致?刚好看到幻方的量化18问,分享出来与大家共赏。以下转至幻方量化公众号:

量化投资只是一个统称,实际上有千千万万种,各不相同。由于每个参与者的观察样本都有局限性,很容易盲人摸象,以偏概全(本文也不例外)。但本文还是试图对A股量化投资的一些基本的问题作出解释。

什么是量化投资

量化投资是指用数学/统计/人工智能等方法取代人工决策,在二级市场进行投资。一般情况下,市场研究、基本面分析、选股、择时、下单等都可以由计算机自动完成。

量化投资的原理

更新时间:2023-06-14 03:02

人工智能的投资神话:零风险,日结账,高回报?

最近几年,“人工智能”和“机器学习”成为金融投资圈中的一个热门词。

举例来说,2017年年底,创新工场创始人李开复在其主题演讲《人工智能四波浪潮与机会》中说道:


有了人工智能以后,它可以去计算哪些中国股票搭配起来跟哪些欧洲、美国股票应该是可以对冲的,它可以判断任何市场有任何不平衡的地方,它可以利用现在人民币换美金的交易障碍,来做更好的对冲,或者它可以判断怎么样能够最优化你该买什么样的股票。过去两年其实我已经没有做任何的个人投资了,我也不把钱交给人了,我现在所有新生产出来的钱都交给机器处理,人已经不能再管理我的钱了,因为人打不过机器,这是非常明确的事情,我们个人投资的这些基金不太

更新时间:2023-06-14 03:02

互联网图像中的像素级语义识别

编者按:“天街小雨润如酥,草色遥看近却无。”

从韩愈的这两句诗可以看出,人对图像内容的语义理解,并不依赖于细粒度监督信息做辅助。

与之相比,在机器学习领域,现阶段的语义分割任务,则依赖于大量的精细标注数据。互联网,作为最为丰富的数据源,吸引着相关从业人员的目光,然而要想利用这些数据,则面临着巨大的标注压力。

因此,引发了两点思考:第一,能否结合关键词信息作辅助,从web中直接学习知识,而不需要精细的人工标注呢?第二,能否利用类别无关的线索,在标注少量类别的数据集上训练好后,将其泛化到其他所有类别物体呢?

本文中,来自南开大学的程明明教授,将从这两点展开介绍目前的研究进展。

更新时间:2023-06-14 03:02

浅谈机器学习和交易

发表一下浅见,别人总讲的我就不讲了,所以难免不成体系且及其局限,见谅。我这里讲的是“机器学习”在“交易”中的应用和局限性,话题限定在交易上,不会涉及风险控制、金融监管等内容。

首先,在交易这一语境下,所谓的机器学习一般指的是,把输入数据映射到目标值上的模型。这里有三个关键词,输入数据、目标值、模型。

输入数据,可以包括公开的资产价格数据、成交量、财报数据、卫星数据、新闻数据、信用数据、分析师评级数据、机构基金持股变化等等,质量参差不齐。

目标值,一般是不同预测周期的资产回报率、目标价格(mid price)、目标现金流质量、风险模型中的残差(residual)、成交量、波动率等等,通常是

更新时间:2023-06-14 03:02

数据科学家需要掌握的10项统计技术,快来测一测吧

无论你是不是一名数据科学家,都不能忽视数据的重要性。数据科学家的职责就是分析、组织并利用这些数据。随着机器学习技术的广泛应用,深度学习吸引着大量的研究人员和工程师,数据科学家也将继续站在技术革命的浪潮之巅。

虽然编程能力对于数据科学家而言非常重要,但是数据科学家不完全是软件工程师,他应该是编程、统计和批判性思维三者的结合体。而许多软件工程师通过机器学习框架转型为数据科学家时,没有深刻地思考并理解这些框架背后的统计理论,所以统计学习理论成为了机器学习的理论框架。

**为什么学习统计学习?**理解不同技术背后的想法是非常重要的,只有真正理解了这些才能知道何时何地使用这些技术。首先必须理

更新时间:2023-06-14 03:02

关于AI的一些杂谈

关于AlphaGo

AlphaGo厉害的地方在于结合了工程和科研两方面的工作,通过大量计算资源和工程优化将一个方向推向了极致,并且同时借鉴了十年来大家在围棋上及在计算机视觉上的点滴进展,围棋和强化学习方向上像蒙特卡罗树搜索,自对弈(俗称“左右互搏”),随机走子盘面估值,用人工特征加浅层网络进行快速走子,权衡广度和深度搜索,权衡从头探索和先验知识,计算机视觉方向上像卷积神经网络(CNN),残差网络(ResNet),旋转翻折样本增强,等等。这些都不是DeepMind团队率先想出来的,而是过去的经验一点点积累起来得到的。只是过去的点滴进步并没有进入公众的视野,而AlphaGo达成了这最后的

更新时间:2023-06-14 03:02

国外近期深度学习与机器学习书籍电子版

\

The LION Way: Machine Learning plus Intelligent Optimization

这是一本机器学习的小册子, 短短300多页道尽机器学习的方方面面. 图文并茂, 生动易懂, 没有一坨坨公式的烦恼. 适合新手入门打基础, 也适合老手温故而知新. 比起MLAPP/PRML等大部头, 也许这本你更需要!

Mathematics for Compute

更新时间:2023-06-14 03:02

人工智能泰斗迈克尔·乔丹分享机器学习要义:创新视角,直面挑战

导语:在迈克尔·乔丹看来,明白人工智能做不了什么、解决不了什么同样非常重要。

2017年6月21日至22日,腾讯·云+未来峰会在深圳举行。腾讯董事会主席兼首席执行官马化腾会带来演讲,多位优秀的学界、产业界人才也会发表自己的见解。雷锋网编辑赴一线报道,并将持续带来最新消息。

21日上午,人工智能领域的世界级泰斗迈克尔·欧文·乔丹(Michael I.Jordan)进行了主题为“机器学习:创新视角,直面挑战”的演讲,与大家分享他对人工智能的未来与挑战的见解。以下为演讲全文:

迈克尔·乔丹:

大家早上好!很荣幸受邀来到这里。我是一名人工智能和统计学方面的研究者,今天我非常高兴来

更新时间:2023-06-14 03:02

概率simple入门

(更正了算式重复显示两次的部分)

该篇内容是Joseph K. Blitzstein的《Introduction to Probability》中的第一章,该概率书非常适合入门。文章是加入自己理解后的总结。以服务于机器学习的理解视角切入。

gitbook阅读地址:[概率 · 超智能体](https://link.zhihu.com/?target=https%3A//yjango.gitbooks.io/superorganism

更新时间:2023-06-14 03:02

论如何优雅地复制期权之OBPI策略

在机器学习、数据挖掘大行其道的今天,我再在这里给大家分享六、七年前股指期货刚推出时国内比较火爆的策略似乎是比较LOWBEE的一件事,一开始我也是拒绝的,但是拒绝并不代表拒绝成功,正如我抗议,抗议无效一样。如果把机器学习比作阳春白雪,我这种只能称为下里巴人了。但能够玩转阳春白雪的人毕竟是少数,所以让我们继续沿着革命的道路前进。不过想到上次ARMA+GARCH交易策略在沪深300指数上的运用这篇文章铩羽而归,内心其实是有点小忐忑的,会不会再一次折戟沉沙,毕竟大家喜欢,才能体现科普文章的价值。

在正式介绍OBPI(O

更新时间:2023-06-14 03:02

Alpha系列——股票主动投资组合管理思想和框架

这是关于股票主动投资组合管理的第一篇教程。在开始介绍正式内容之前,我先简要简要说一下《Alpha系列》的初衷。

近年来,随着国内大数据和人工智能的迅速崛起,量化交易领域也有了长足的发展。 从原来的指标驱动型程序化交易,演化到现在的以机器学习、人工智能为代表的新型量化交易。同时,量化交易的门槛与过去相比下降了许多。 不仅是因为这些年数据科学的发展带动了python及其生态的成熟和推广,更由于类似tushare、vnpy、zipline等开源项目以及像quantopian、bigquant等量化平台的出现, 使得以前做量化先造轮子到现在量化从业者可以专注于策略的研发,使得更多的人能够进入到这个领

更新时间:2023-06-14 03:02

金融交易中的机器学习与统计

金融数据的特点是时间序列,这意味着传统预测模型(包括机器学习和统计,为避免不必要的学派之争,统一称为预测模型)使用的训练集、验证集、测试集的方法或许不大适用,特别是交叉验证,很难说用后面的数据验证前面的数据算不算样本外,毕竟现实中只能前面的数据先发生。但也有人说我近期观察到一个pattern,最近几天都出现,想看看在历史行情中表现如何......

另外还有人说我拿奇数年的数据做个模型,然后拿偶数年的数据验证一下,这样是否靠谱?比如十年数据,一般来说,1-5做训练,6-10做预测,效果会最差;1-5预测6,1-6预测7,这样滚动着来,效果可以好一些,这些都可以算作严格的样本外;如果是1

更新时间:2023-06-14 03:02

万字干货转载 量化投资的方法论


写在文前:周末为大家奉上一篇来自棋剑资产王晓光的一篇报告,文有点长,但是确实系统地讲解了量化投资这件事。海纳百川,多学习不同的观点能拓宽视野。先祝大家周末快乐。

![](data:image/svg+xml;utf8,<svg xmlns='http://www.w3.org/2000/svg' width='500' height='270'></svg>)

*原文:

更新时间:2023-06-14 03:02

一个基于机器学习的纯量化框架出世,助力风险投资!

近几年,以机器学习、特别是深度学习为代表的人工智能(AI)得到了长足的发展,机器学习和人工智能也成为出现在街头巷尾的高频词汇。今天我们把目光放在风险投资(venture capital),看看机器学习能否在一级市场有所作为。

写本文的动机源自作者最近读到的一篇来自麻省理工的论文 Hunter and Zaman (2017)。该文提出了一个挑选优秀早期创业公司的量化分析框架,利用机器学习算法进行参数估计以及最优投资组合的构建,从而挑出那些最有可能成功的初创公司(成功的标准是风险投资人因该公司上市或者被收购而退出)。

因为文章很新(2017 年的),而且将机器学习应用于了一个比较新的

更新时间:2023-06-14 03:02

《机器学习》笔记-模型评估与选择(2)

写在最前面

如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好奇,还是自身充电,跟上潮流,我觉得都值得试一试。对于自己,经历了一段时间的系统学习(参考[《机器学习/深度学习入门资料汇总》](https://link.zhihu.com/?target=https%3A//link.jianshu.com/%3Ft%3Dhttps%253A%252F%252Fcaiquanliu.github.io%252F2017%252F11%252F12%252F%2525E6%25259C%2525BA%2525E5%25

更新时间:2023-06-14 03:02

模型的选择、评估和优化-上

在本文中,我将介绍机器学习的模型选择、评估和优化

因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。

[模型的选择、评估和优化-上​chrer.com](https://link.zhihu.com/?target=http%3A//chrer.com/2018/07/21/%25E6%25A8%25A1%25E5%259E%258B%25E7%259A%2584%25E9%2580%2589%25E6%258B%25A9%25E3%2580%2581%25E8%25AF%2584%25E4%25

更新时间:2023-06-14 03:02

聚类-下

在本文中,我将介绍机器学习中关于聚类的算法。

因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。

[聚类-下​chrer.com 图标](https://link.zhihu.com/?target=http%3A//chrer.com/2018/07/29/%25E8%2581%259A%25E7%25B1%25BB-%25E4%25B8%25

更新时间:2023-06-14 03:02

掌握线性代数为机器学习打下坚实基础!


线性代数是数学领域,也是机器学习领域重要的支柱。对于初学者来说,要想学好机器学习,线性代数的掌握是必不可少的,也可以说是十分十分重要的。

春节后的第一天,公众号特此为大家分享一份这样的顶级学习清单。希望大家在新的一年里,学业有成,事业更旺。同时也感谢大家对公众号一直以来的支持与厚爱!

维基百科

一些高层次的学习网页:

  • 线性代数

[https://en.wikipedia.org/wiki/Linear_algebra](https://link.zhihu.com/?target=https%3A//en.wikipedia.org/wiki/L

更新时间:2023-06-14 03:02

特征!特征!特征!——人工智能选股之特征选择

摘要

特征选择是人工智能选股策略的重要步骤,能够提升基学习器的预测效果

特征选择是机器学习数据预处理环节的重要步骤,核心思想是从全体特征中选择一组优质的子集作为输入训练集,从而提升模型的学习和预测效果。我们将特征选择方法应用于多因子选股,发现特征选择对逻辑回归_6m、XGBoost_6m基学习器的预测效果有一定提升。我们以全A股为股票池,以沪深300和中证500为基准,构建行业中性和市值中性的选股策略。基于F值和互信息的方法对于逻辑回归_6m、XGBoost_6m、XGBoost_72m基学习器的回测表现具有明显的提升效果。

**随着入选特征数的增加,模型预测效果先上升后

更新时间:2023-06-14 03:02

番外篇(1)——最速下降法

番外篇正式开始,我们主要利用番外篇的时间聊一些机器学习中的黑盒部分——没错,就是优化算法。之前接受过前辈的教诲,一个机器学习的套路可以分解成三个部分——模型,目标和优化方法。模型用来定义待解决的问题,目标(一般也会被称作损失函数)用来明确评价模型质量的方法,而优化算法则是具体解决求解过程的问题。有了这三个部分,我们可以说在学术的角度上我们基本上就搞定了一个机器学习问题。之所以在前面加上了学术这两个字,是因为在工业界一个机器学习的问题就不止这三部了。

好了回到正题,我们回到前面的三个部分,一般来说第一部分是最灵活的,第二部分也算灵活,但还是有一定的约束的,然而第三部分——一般来说都是非常确定的

更新时间:2023-06-14 03:02

量化系列


\

更新时间:2023-06-14 03:02

AIQ | Spark 团队开源新作:全流程机器学习平台 MLflow

AIQ 机器学习大数据 知乎专栏 点击关注


策划编辑 | Natalie作者 | Matei Zaharia译者 | 无明编辑 | Vincent**AI 前线导读:**在昨天开幕的 Spark+AI Summit 大会上,Spark 和 Mesos 的核心作者兼 Databrick 首席技术专家 Matei Zahari

更新时间:2023-06-14 03:02

模型的选择、评估和优化-下

在本文中,我将介绍机器学习的模型选择、评估和优化

因为知乎中对于markdown的支持太差了,本文不在知乎直接排版,所以阅读体验不是很好,若想获得更好的阅读体验,请点击下文链接进行阅读。

[模型的选择、评估和优化-下​chrer.com 图标](https://link.zhihu.com/?target=http%3A//chrer.com/2018/07/21/%25E6%25A8%25A1%

更新时间:2023-06-14 03:02

分页第1页第2页第3页第4页第5页第20页