基于统计方法的股票短线收益预测
——以Google的股票数据为例
一. 问题的背景提出
关于如何选择股票,100多年来人们创造出各种方法,多得使人感觉目不暇接,但
是不论有多少变化,可以归纳为基本的几种投资策略。
1. 价值发现:
价值发现方法的基本思路,是运用市盈率、市净率等一些基本指标来发现价值被低估的个股。
2. 选择高成长股:
它关注的是公司未来利润的高增长,而市盈率等传统价值判断标准则显得不那么重要了。
3. 技术分析选股:
技术分析是基于以下三大假设:
(1) 市场行为涵盖一切信息;
(2) 价格沿趋势变动;
(3) 历史会重演。
在上述假设前提下,以技术分析方法进行选股,通常一般不必过多关注公司的经营、财务状况等基本面情况,而是运用技术分析理论或技术分析指标,通过对图表的分析来进行选股。
4. 立足于大盘指数的投资组合
如果有一个与大盘一致的指数基金,投资者就不需要选股,只需在看好股市的
时候买入该基金、在看空股市的时候卖出。
而本文关注的技术分析选股,并且希望通过统计方法根据技术指标对股票短线收线
进行预测。
二. 模型的假设与建立
2.1 股票数据结构:交易的日期,开盘价(Open),最高价(High),最低价(Low),收盘价(Close),交易量(Volume),调整的收盘价(Adjusted Price)。
2.2 定义目标变量:股票短线收益
日平均价近似为:

设 
为接下来第K天日平均价对第i天的变动率(算术收益率):

而指标 
定义为绝对值大于p%的那些变动率的总和:

为正且较大时说明在未来K天内股价处于上升状态可能性较大,买入信号。
为负且绝对值较大时说明在未来K天内股价处于下降状态可能性较大,卖出信号。
2.3 确定解释变量
根据在网络上找到的技术指标中的“趋势型指标”来确定解释变量。选取R-Package里面的TTR包。最终确定解释变量如下:
ATR,衡量序列波动
SMI,动量指标
ADI,平均方向性运动指标
Aroon,扑捉起始趋势的;
BollingerBands,比较一段时期的波动率
ChaikinVol,佳庆离散指标
EMV,简易波动指标
MACD,平滑异同平均线
MFI,资金流量指标
SAR,停损点………………..
三. 模型求解
略(见附录的文件吧,文章长度超过了)
四. 模型的不足与优化
1. 本模型只考虑了“趋势型”指标,对于其他技术指标则没有分析,故有一定的片面性。
2. 本模型没有考虑大盘指数的趋势,而股票的价格往往跟大盘指数有着紧密的联系。
五. 附录
R-code.txt
六. 参考文献DataMining with R: Learning with Case Studies