1、京东大数据京东大数据包含了主要消费类别网购的售价数据与销售数据,涉及:中国办公设备、中国电脑、中国服装鞋包、中国个护化妆、中国家居家装、中国家用电器、中国酒类、中国母婴保健、中国食品饮料、中国手机数码、中国运动户外和中国珠宝首饰。
京东大数据以月度为频率,详细统计了相关消费品网购的售价于销量,真实的反映出相关消费品的销售情况。产品的销售情况直接影响以该产品为主营产品的公司,并且最直接体现在其利润率等关键财务因子上,进一步对该公司股票价格产生重要影响。
从经济逻辑角度看,这些数据对于相关消费类公司股价是有一定解释力的。数库针对京东大数据的具体类别,以SAM节点为基础编制了对应的消费指数,将网购售价和销量数据与相关的上市公司建立了联系,为基于京东大数据构建投资策略提供了基础。
2、京东大数据与数库指数绝对收益的相关性考察当月指数绝对收益率与上月京东大数据价格和销售指数增长率的关系,利用2014年3月-2016年5月的数据计其相关性。
指数绝对收益率=当月最后一个交易日的指数值/当月第一个交易日的指数值-1
京东大数据价格增长率=当月价格指数/上一个月价格指数-1
京东大数据销量增长率=当月销量指数/上一个月销量指数-1
为了使数据统计结果有投资意义,以下检验都采用上个月的京东大数据数据和当月的指数收益率数据,避免“look-ahead”偏差。
表1:京东大数据与数库指数绝对收益率的相关性
京东大数据 | 数库指数 | 相关性 |
京东金融指数 - 中国办公设备网购价格指数 | 京东办公设备指数 | 0.014878 |
京东金融指数 - 中国办公设备网购销售指数 | 京东办公设备指数 | -0.30936 |
京东金融指数 - 中国电脑网购价格指数 | 京东电脑指数 | 0.343343 |
京东金融指数 - 中国电脑网购销售指数 | 京东电脑指数 | 0.049653 |
京东金融指数 - 中国服装鞋包网购价格指数 | 京东服装鞋包指数 | -0.13637 |
京东金融指数 - 中国服装鞋包网购销售指数 | 京东服装鞋包指数 | 0.006039 |
京东金融指数 - 中国个护化妆网购价格指数 | 京东个护化妆指数 | 0.114954 |
京东金融指数 - 中国个护化妆网购销售指数 | 京东个护化妆指数 | 0.070313 |
京东金融指数 - 中国家居家装网购价格指数 | 京东家居家装指数 | -0.14338 |
京东金融指数 - 中国家居家装网购销售指数 | 京东家居家装指数 | 0.01873 |
京东金融指数 - 中国家用电器网购价格指数 | 京东家用电器指数 | 0.19177 |
京东金融指数 - 中国家用电器网购销售指数 | 京东家用电器指数 | 0.168614 |
京东金融指数 - 中国酒类网购价格指数 | 京东酒类指数 | 0.159529 |
京东金融指数 - 中国酒类网购销售指数 | 京东酒类指数 | 0.188013 |
京东金融指数 - 中国母婴保健网购价格指数 | 京东母婴保健指数 | -0.10102 |
京东金融指数 - 中国母婴保健网购销售指数 | 京东母婴保健指数 | 0.095269 |
京东金融指数 - 中国食品饮料网购价格指数 | 京东食品饮料指数 | -0.2237 |
京东金融指数 - 中国食品饮料网购销售指数 | 京东食品饮料指数 | -0.0007 |
京东金融指数 - 中国手机数码网购价格指数 | 京东手机数码指数 | -0.02647 |
京东金融指数 - 中国手机数码网购销售指数 | 京东手机数码指数 | 0.120063 |
京东金融指数 - 中国运动户外网购价格指数 | 京东户外运动指数 | 0.155222 |
京东金融指数 - 中国运动户外网购销售指数 | 京东户外运动指数 | -0.02824 |
京东金融指数 - 中国珠宝首饰网购价格指数 | 京东珠宝首饰指数 | 0.022977 |
京东金融指数 - 中国珠宝首饰网购销售指数 | 京东珠宝首饰指数 | 0.069003 |
从以上统计结果可以大致的看出,当月指数收益率与相关消费品的售价成正相关,与相关消费品的销量呈负相关,但是相关性不是很显著。
3、基于京东大数据的投资策略由于京东大数据的售价和销量数据与相关消费品指数的相关关系不是很显著,因此直接基于京东大数据构建交易策略是法取得显著收益的,分析原因,在于商品的售价于销量也是相互影响的。比如某商品当月售价提升,提升后的售价超过了消费者的心理预期,导致该商品销量下降,对生产该商品的公司利润产生负面影响,使得该公司下个月的股价下跌。当然,也会出现某商品售价与销量同时增长的情况,这对于相应公司股价将是极大的利好。由此可见,综合考虑京东大数据的售价和销量数据是更加合理的方法。
基于京东大数据的网购价格和销量数据,构建一个新的因子Q,定义Q:

其中,P是京东大数据中消费品的网购价格,S是京东大数据中消费品的网购销量。
基于因子Q,可以构建相应的投资策略:每个月月初计算京东大数据各个消费类别的因子Q,并从大到小进行排序;针对相应的数库消费品指数,买入排名前四分之一的指数做为高配组,买入排名后四分之一的指数做为低配组;每月进行换仓。
回测起止时间为:2014年02月01日至2016年05月01日。
4、策略回测结果基于上述策略思想进行回测,因子检验以及策略回测结果如下。
4.1、因子IC值图表 1因子IC值 |
|
资料来源:数库(上海)量化研究部 |
因子IC值是考察因子有效性的重要指标,实践表明,当因子IC值高于0.02时,因子对收益率具有一定的预测性。对因子Q的因子检验得出,其IC值的平均值为:0.075,表明因子Q对收益率具有很强的预测性。
4.2、因子收益率在因子检验中,通常将高配组的收益率与低配组的收益率的差值作为因子收益率。因子收益率越显著稳定,表明因子的预测性越强。
图表 2因子累积收益率 |
|
资料来源:数库(上海)量化研究部 |
因子Q的累积收益率稳定而显著,表明其具有较强的预测性。
4.3、策略回测结果表2:策略回测指标统计
分组 | 年化收益率 | 累积收益率 | 最大回撤 | 夏普比率 | 卡玛比率 |
高配组 | 30.75% | 82.82% | 33.79% | 0.688 | 0.910 |
低配组 | 4.82% | 11.92% | 46.12% | 0.126 | 0.104 |
图表 3策略净值曲线 |
|
资料来源:数库(上海)量化研究部 |
回测结果显示,高配组收益显著稳定的跑赢了低配组,表明该投资策略的有效性。在大盘风险的影响下,高配组策略依然可以取得年化30.75%、最大回撤33.79%的优秀表现,验证了京东大数据的有效性。
5、结论和讨论
基于京东大数据——消费品的网购价格和销量数据,数库以SAM产品分项为基础,构建了相应的消费品指数,为京东大数据运用于投资提供了基础;在对京东大数据和相应的消费品指数的检验中发现,消费品的售价和销量数据是同时作用于相应的消费品指数收益率的,该报告结合网购售价和网购销量数据构建出一个新的alpha因子,其IC值高达0.075,并且具有稳定显著的因子收益率,表明该因子是一个具有强烈预测效应的因子;基于该因子构建相应的投资策略,高配组取得了年化30.75%、最大回撤33.79%的优秀表现,验证了京东大数据的有效性,并为投资者使用京东大数据提供了有效的方法。
量化投资群
兴趣范围包括:量化投资,算法交易,金融建模,统计套利等等
QQ群 517910091