当前位置: > 财经>正文

谈一谈量化投资从哪里获取数据(会经常更新

2023-07-14 15:16:59 互联网 未知 财经

谈一谈量化投资从哪里获取数据(会经常更新

数据的重要性巧妇难为无米之炊

数据是基础,是量化研究的一个关键环节,没有数据,量化就是无源之水,无根之木。所以,数据必须有。

垃圾进垃圾出

数据分析领域有一个名言,“Garbage in, Garbage out”,如果我们在模型里面,输入的数据有很多细节没有处理好,我们模型计算出来的结果,甚至有可能南辕北辙,模型的可信度大大降低。所以,数据要尽可能精确。

如何选择一个好的数据源?免费 or 收费?

这是一个利弊权衡取舍的问题。这个世界上,不存在完全免费的东西,任何看似免费的东西,都是在以另一种方式收费。市场上的很多数据生产商,也必然遵循这个规律。究竟应该是选择免费的数据还是收费的数据呢?

个人量化研究者,建议选择免费的数据源,机构量化投资者,建议选择收费的;相对而言,收费数据的质量可能是更高一些,当然,也不绝对(事实证明,我这句话很有先见之明,有好多收费数据也是很垃圾的)

有哪些免费的数据可以使用?

大家最感兴趣的,可能是这个了。我按照我使用的频率,从最常用的,使用过的,知道的,做一个列表,供大家参考;数据提供商的排名,不分先后。

曾经使用过的

尝试使用过的数据有很多,大多数都是在其平台中使用免费,不能下载到本地,本地数据收费。

JData(聚宽数据) 提供了python版本的API,很方便的调用相应的数据。后面还提供了C#,C++,R,matlab等语言调用数据的接口。免费版本刚开通试用期间,最开始是1000万条每天,后来,就变成每天100万条数据,基本够用。tbquant(交易开拓者) 使用tbquant获取数据主要是平时我们交易主要使用tbquant。朝阳永续-CTA基金指数(废弃) 这个指数最近已经不更新了。米筐

vnpy官方只提供了米筐的借口,据说数据质量很高。我用的少。提供了一个金融终端和网页版的线上平台,可以在上面写策略,免费用数据。本地数据,每天有限额,而且只提供一个月的免费试用。(2023-07-21 在没有使用米筐之前,我一直觉得米筐的数据质量挺好的,只有付费使用之后,才发现,还是聚宽的数据质量更好一些,而且对bug的修复反馈更快一些。现在给他们反馈期货1小时数据有好多收盘价为0的数据,应该有快一个月了,还没有修复。收盘价都能为0,可以想象,这数据质量是什么样的!!!)

再来吐槽一下米筐的数据与服务,今天刚好要去下载米筐的数据,就来更新一下,他们客服服务也不好,说收盘价为0的错误解决了会通知我,现在已经三个月左右了,还没有解决。特别服。有些数据厂商都是在收智商税!

5. 万矿-wind旗下的量化平台

在其线上平台上,可以免费试用wind的数据。这个还是要推荐一下的。后来,经常碰到用着用着就崩溃的情况,就不常使用了。如果仅仅是做一些研究,还是推荐使用这个平台的,毕竟,wind数据的质量还不错,而且比较全一些。

6.tushare

做量化的,很多人使用tushare去爬取数据。以前使用的时候,碰到爬大量的数据,网页会禁止,访问量太大,适合数据较少得到研究,是一股清流。后续开始搞积分制之后,我就没怎么参与了,改天可以尝试下,看下下载数据和数据质量如何。

7.quantopian

国外的一个量化平台,提供美股和期货的数据,并且有自己开源的框架zipline,在github上比backtrader的排名还高,但是,要想在中国市场上使用,需要做一定的改进。据说,聚宽,米筐这些平台,都是参考zipline的框架,开发的,他们的api都挺像的。

8.掘金量化

掘金量化也用过。提供股票期货的数据,而且提供多种语言的编程接口,感兴趣可以去尝试一下。

9.东方财富网

数据全,质量还不错,可以爬。爬过基金的相关数据。

10. 国泰安(CSMAR)数据库

我们学校购买的有国泰安的数据库,做毕业论文的时候有使用过。数据质量挺不错的。

11. 锐思(RESSET)数据库

同样是学校图书馆购买的,做毕业论文的时候使用过。有股票期货相关的数据。

12. 优矿-通联数据

通联数据的规则改了,只能每天下载100M的数据了,基本没法从上面导数据了,满足不了需求。

未使用过:

bigquant发明者akshare 去官网看了下,内容挺全面的,点赞。改天去试一下。

更新

baostock

后续随着接触的数据提供商

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。