量化百科

量化投资从哪里获取数据

由adminking创建,最终由adminking 被浏览 57 用户

数据的重要性

巧妇难为无米之炊

数据是基础,是量化研究的一个关键环节,没有数据,量化就是无源之水,无根之木。所以,数据必须有。

垃圾进垃圾出

数据分析领域有一个名言,“Garbage in, Garbage out”,如果我们在模型里面,输入的数据有很多细节没有处理好,我们模型计算出来的结果,甚至有可能南辕北辙,模型的可信度大大降低。所以,数据要尽可能精确。

如何选择一个好的数据源?

免费 or 收费?

这是一个利弊权衡取舍的问题。这个世界上,不存在完全免费的东西,任何看似免费的东西,都是在以另一种方式收费。市场上的很多数据生产商,也必然遵循这个规律。究竟应该是选择免费的数据还是收费的数据呢?

个人量化研究者,建议选择免费的数据源,机构量化投资者,建议选择收费的;相对而言,收费数据的质量可能是更高一些,当然,也不绝对。

有哪些免费的数据可以使用?

大家最感兴趣的,可能是这个了。我按照我使用的频率,从最常用的,使用过的,知道的,做一个列表,供大家参考;数据提供商的排名,不分先后。

基本每天会用到的

  1. JData(JQ数据) 提供了python版本的API,很方便的调用相应的数据。后面还提供了C#,C++,R,matlab等语言调用数据的接口。免费版本刚开通试用期间,最开始是1000万条每天,后来,就变成每天100万条数据,基本够用。官方链接请点击
  2. tbquant(交易开拓者)

工作中经常接触,用tbquant数据和JQ数据相互验证,防止某一方出错。大家忽略哈。

曾经使用过的

尝试使用过的数据有很多,大多数都是在其平台中使用免费,不能下载到本地,本地数据收费。

  1. YQ-通联数据

最开始接触量化,使用的是YQ的数据,他们有一个专门的数据提供商,通联数据。他们后来限制了下载的数据量,现在好像每天只能用200M,再加上,很多数据都试用过了,只有一个月的试用期,就很少用了。

  1. RQ

vnpy官方只提供了米Q的借口,据说数据质量很高。我用的少。提供了一个金融终端和网页版的线上平台,可以在上面写策略,免费用数据。本地数据,每天有限额,而且只提供一个月的免费试用

  1. 万矿-wind旗下的量化平台

在其线上平台上,可以免费试用wind的数据。这个还是要推荐一下的。后来,经常碰到用着用着就崩溃的情况,就不常使用了。如果仅仅是做一些研究,还是推荐使用这个平台的,毕竟,wind数据的质量还不错,而且比较全一些。

  4.tushare

做量化的,很多人使用tushare去爬取数据。以前使用的时候,碰到爬大量的数据,网页会禁止,访问量太大,适合数据较少得到研究,是一股清流。后续开始搞积分制之后,我就没怎么参与了,改天可以尝试下,看下下载数据和数据质量如何。

  5.quantopian

国外的一个量化平台,提供美股和期货的数据,并且有自己开源的框架zipline,在github上比backtrader的排名还高,但是,要想在中国市场上使用,需要做一定的改进。据说,JQ,RQ这些平台,都是参考zipline的框架,开发的,他们的api都挺像的。

  6.掘金量化

掘金量化也用过。提供股票期货的数据,而且提供多种语言的编程接口,感兴趣可以去尝试一下。

  7.东方财富网

数据全,质量还不错,可以爬。爬过基金的相关数据。

  8. 国泰安( **CSMAR** )数据库

我们学校购买的有国泰安的数据库,做毕业论文的时候有使用过。数据质量挺不错的。

  9. 锐思( **RESSET)数据库**

同样是学校图书馆购买的,做毕业论文的时候使用过。有股票期货相关的数据。

闻名而未见面的

  1. baostock
  2. bigquant
  3. 发明者
  4. akshare 去官网看了下,内容挺全面的,点赞。改天去试一下。

\

标签

量化投资量化研究数据处理