导语《Machine Learning for Stock Price Forecasting》是Ali El-Shayeb撰写的机器学习系列文章 ,本文主要介绍其第二部分内容——《监督式机器学习算法的应用》,并将其思想和代码应用在中国股票市场,开发出具有择时功能的监督式
机器学习算法,最后进行策略回测。对此感兴趣的小伙伴可以下载pdf版本,进行深入和扩展研究。
《监督式机器学习算法的应用》Ali El-Shayeb通过价格和成交量相关的9个特征训练模型,特征列表和数据来源见下图。
 
作者希望训练出一个二分类模预测模型,来预测市场属于牛市还是熊市状态。在训练集数据处理上,如果交易日t+30价格小于t交易日价格,那么标注为0,否则标注为1。通过特征数据和标注数据可以训练出一个二分类模型,接着在预测集上进行预测,如果预测结果为1,表明为买入信号,如果预测集为0,表明是卖出信号。最后,通过预测结果回测检验策略收益曲线。
需要补充的一点是,作者将训练集上80%的数据作为训练集,20%的数据作为验证集,在验证集上评估策略的预测效果。评估指标为准确率,准确率计算公式为预测正确的天数与总预测天数的比值。