之前看过一些免费的数据开放平台,比如Tushare,easydata,opendatatool,但这些工具,后面要么不开源了,要么不维护了。对于我们这些学生党来说,一方面需要用数据,一方面也要学习编程技术。所以,找一个完全开源和免费的数据才是王道。
昨天,偶遇某博,聊到数据的事情,提到一个新的开源项目DTShare,起初没太在意,回到家后一看,里面眼前一亮的赶脚,全部是代码啊~~
先上地址:
官网:
http://dt-share.com
Github:
https://github.com/DTShare/dtshare
且等我慢慢道来
1、先说官网
打开官网,一种小清新的感觉扑屏而来,这是我喜欢的风格,因为是也是通过开源、开源、开源来的,用的是Gitbook。
网站一句话很显眼:DT时代的数据共享,想必DTShare的名字就是这个由来吧?
从内容角度,对于我这个新手来说,还有有不少帮助,不仅有安装和升级说明,还有pandas的学习手册,这个是加分项啊!!!
另外,数据也非常清晰,包括股票、指数、基金、期货等数据,非常全面。
再看了一下作者简介,有点要笑喷了,太他博的实在,什么实话都说了,也不枉博士学历了。
2、Github
从描述来说,还是比较简洁的,有过程说明有用列讲解,所以看起来还非常像一个专业的开源项目:
3、数据内容
可以看到,基本上覆盖了金融工程投研所需要的所有数据。一番惊喜之后,我要开始安装使用了:
导入包,调取数据:import dtshare as dt
df = dt.get_tick_data('000001')
print(df)
打印数据: date open close high low volume code
0 2017-07-27 13.241 13.241 13.330 13.142 336120.0 600000
1 2017-07-28 13.231 13.330 13.350 13.162 249549.0 600000
2 2017-07-31 13.310 13.221 13.379 13.172 450830.0 600000
3 2017-08-01 13.280 13.290 13.350 13.182 641980.0 600000
4 2017-08-02 13.300 13.300 13.459 13.251 616441.0 600000
.. ... ... ... ... ... ... ...
635 2020-03-09 11.000 10.780 11.000 10.750 594952.0 600000
636 2020-03-10 10.710 10.870 10.960 10.700 447617.0 600000
637 2020-03-11 10.930 10.770 10.930 10.770 316888.0 600000
638 2020-03-12 10.750 10.640 10.750 10.610 326324.0 600000
639 2020-03-13 10.400 10.700 10.730 10.280 574571.0 600000
[640 rows x 7 columns]
看完之后,大家有什么想说的? 欢迎留言评论!