作者:Call    原文链接:
追踪聪明钱 - A股市场交易的微观结构初探
1. 前言前两天读了方正证券研究所的研报『跟踪聪明钱-从分钟线到选股因子』[1],对研报中的思想非常感兴趣,所以通过uqer平台,对其进行深入研究。
在一个非完全有效的市场中,信息的传播总是一个从点到面的过程,这一过程中最先接触到信息的投资者当然具有巨大的优势,研报中试图通过分钟线的交易数据来寻找这些最先接触到信息的资金的动向,这些资金我们称之为“聪明钱”。
在下文中,我首先通过定义好的聪明度指标,构造了股票的聪明度因子Q,然后基于此聪明度因子进行回测研究。
2. 基于分钟线行情数据的聪明钱情绪因子聪明钱在交易过程中,往往呈现“单笔订单数量更大,订单报价更为激进”的特征[2],所以使用以下指标S来衡量每一分钟交易的“
聪明程度”:

其中,

 为第t分钟的涨跌幅,

 为第t分钟的成交量。指标 

的值越大,则表示该分钟的交易越“聪明”。借助指标S,我们可以通过以下方法筛选聪明钱的交易:
- 对于特定股票、特定时段的所有分钟行情数据,将其按照指标 S 从大到小进行排序;
- 在按 S 排好序的分钟成交量数据中,将成交量累积占比前 20% 视为聪明钱的交易;
 
这一过程可以通过下图展示:

如上所示,首先对于30条样本分钟线计算S因子(上图);其次以S因子由大到小的顺序重新对这些分钟线排序,并按此顺序计算成交量累积占比(下图),截取S因子最大的前20%成交量所包含的分钟线(下图中的红色柱子)作为聪明钱。
如上划分找到聪明钱之后,我们就可以通过这些聪明钱的交易数据来构造
聪明钱的情绪因子Q:

其中,

是聪明钱的成交量加权平均价,

是所有交易的成交量加权平均价。可以看出,因子Q 实际上反映了在该时间段中聪明钱参与交易的相对价位。之所以将其称为聪明钱的情绪因子[1],是因为:
- Q越大,表明聪明钱的交易越倾向于出现在价格较高处,这是逢高出货的表现,反映了聪明钱的悲观态度;
- Q越小,则表明聪明钱的交易多出现在价格较低处,这是逢低吸筹的表现,是乐观的情绪。
 
3. 聪明钱情绪因子Q选股为了进行因子回测研究,首先我们需要计算Q因子的历史数据(
点击查看原文代码):
通过以上代码,我们计算了聪明钱情绪因子Q的历史数据,即在每月最后一个交易日,计算该日
前10日的聪明钱情绪因子Q;
示例数据如下:

同时计算了的历史前瞻区间收益率(这个是为了下一步说明Q因子选股的有效性),具体操作是在每个交易日,计算该日
后20日每只股票的区间收益率;
示例数据如下:

这里计算完A股股票过去四年多的月度Q因子和相应的前瞻收益率后将其保存在csv文件中(因为Q因子用的是分钟线,计算历史数据相对耗时)。
接着计算Q因子和相应的前瞻收益率的相关系数,测试Q因子对于未来股票收益的解释能力(
点击查看原文代码):
- 每月最后一个交易日,计算每只股票的情绪因子Q(基于该交易日前10日的分钟线数据,直接读取之前保存的csv文件即可);
- 每月最后一个交易日,计算每只股票在该日后20日的收益率(同样可以直接读取csv文件);
- 每月最后一个交易日,计算情绪因子Q和次月收益率的相关系数;
 
计算月度RankIC的总数目:
 41 显著正相关的月数目: 7 
显著负相关的月数目: 25 
相关性不显著的月数目: 9
 
由上图所示,因子值与次月收益的秩相关系数(RankIC),显著为正的有7个(红柱),显著为负的有25个(绿柱),相关性不显著的有9个(黑柱)。聪明钱情绪因子Q与次月收益率的 RankIC 基本为负,也就是说跟随聪明钱的投资方向(低位吸筹)是有利可图的。
接下来,测试上述计算得到的
聪明钱情绪因子Q的选股能力的回测效果。历史回测的设置如下:
- 回测时段为2013年1月31日至2016年6月30日;
- 股票池为A股全部股票,剔除上市未满60日的新股(计算Q因子时已剔除);
- 组合每月月底调仓,交易费率设为双边万分之二;
- 调仓时,涨停、停牌不买入,跌停、停牌不卖出;
- 每月底调仓时,选择股票池中Q最小的10%的股票;
 
回测结果如下:

从回测结果可以看出,聪明钱情绪因子Q作为选股的信号,表现比较优秀,可以从阿尔法、夏普比率、信息比率等多个指标得到反映。
进一步,计算得到利用上述策略回测对冲中证500指数后净值走势图:

上图中,展示了之前在全A股股票池中进行的“Q最小的10%股票月度调仓”回测的结果,其中的红色曲线显示出对冲中证500指数后的净值走势,可以看到对冲后的净值走势非常稳定。
为了更好地展示聪明钱情绪因子Q的选股能力,我对由Q因子五分位数的每个分位数区间对应的股票进行回测(回测基本参数设置同上面策略):

上面的图片显示“Q因子-不同五分位数分组选股月度调仓”的净值走势,下面一张图展示出各组头寸对冲完指数后的净值走势,可以看到:
不同的五分位数组对应的净值走势顺序区分度很高!
我画了一个表格展示出不同分位数组合的各项风险指标,
每次调仓均买入聪明钱情绪因子Q最小的20%股票的策略,可以看到各项指标表现都非常出色:

总结一下:我根据研报中聪明钱情绪因子Q构建了股票组合,表现最好的组合在13年以来年化收益达到47.3%,信息比率高达3.4,夏普比率为1.3;进一步,组合对冲中证500指数后,年化收益达到25%,最大回撤仅4.6%,展示出稳定跑赢指数的能力。感兴趣的朋友欢迎到社区一起探讨交流。
参考资料:
[1] 方正证券研究所证券研究报告,『跟踪聪明钱:从分钟行情数据到选股因子』 “聆听高频世界的声音”系列研究(三)
[2] 《订单簿信息透明性对投资者行为和市场质量的影响》(上海证券交易所研究中心,2006)、《个人与机构投资者订单主动性比较》(管理评论,2004).