摘要
时间序列数据包括多元时间序列和一元时间序列两种数据类型。一元时间序列的相关研究较多,也逐渐形成一套成熟的理论和方法;然而多元时间序列的数据结构比一元时间序列更复杂,现有的理论和方法仍不够完善。多元时间序列数据在金融、医学、过程监控等领域中被大量采集,因此发展和完善多元时间序列挖掘的方法研究具有重要的意义。相似性度量是金融时间序列挖掘中的一项关键技术,但现有的度量方法不适合分析小规模的金融多元时间序列。作为金融多元时间序列参数化建模的预处理过程,平稳性分析可以采用聚类方法来完成,但准确率偏低。金融投资组合可以将多个一元时间序列组合成一个多元时间序列,时间序列聚类方法为资产选择提供了有力的支持,但仍缺乏相关的理论和验证。金融高频数据是一种不等间隔的时间序列,现有的相似性查找技术对高频数据的处理效果不佳。本文以金融多元时间序列相似性分析为研究主线,首先研究了多元时间序列挖掘中的小规模数据相似性度量问题,然后采用时间序列聚类方法来研究平稳性分析和金融投资组合,最后就金融高频数据的相似性查找展开研究。作为研究基础,本文包括了部分一元时间序列挖掘方法的研究。文中也提出了一些解决问题的方法,它们具有一定的理论意义和实际应用价值。本文的主要工作和贡献如下:1.深入研究金融多元时间序列的数据结构特点,提出采用三维空间的曲面图来描述金融多元时间序列;该方法对其他领域的多元时间序列的形状刻画也具有较好的性能; 2.针对金融领域中的小规模多元时间序列相似性分析,提出了基于点分布特征的多元时间序列相似性度量方法;3.采用聚类方法实现了金融多元时间序列平稳性的自动分类,并提出了非线性转换理论,大幅度提高了传统平稳性分析方法的准确率;4.针对金融投资组合问题,提出了多重二值函数的相似性度量方法,并采用时间序列聚类方法建立金融资产选择的依据;5.提取多元时间序列的自相关函数的多重非线性特征,以此来建立金融高频数据的相似性查找方法,并就金融高频数据的趋势预测展开具体的应用研究。
目录
- 摘要4-6
- 英文摘要6-13
- 第一章 绪论13-30
- 1.1 研究背景与选题意义13-19
- 1.1.1 金融数据分析13-14
- 1.1.2 时间序列挖掘14-18
- 1.1.3 研究的目的和意义18-19
- 1.2 研究现状及存在的问题19-26
- 1.2.1 多元时间序列挖掘技术及应用19-22
- 1.2.2 金融多元时间序列挖掘22-24
- 1.2.3 存在的主要问题24-26
- 1.3 本文的主要内容及特色26-28
- 1.4 本文的内容安排28-30
- 第二章 多元时间序列挖掘技术及应用30-59
- 2.1 时间序列数据类型30-35
- 2.1.1 多元时间序列30-34
- 2.1.2 不等间隔时间序列34
- 2.1.3 时间序列数据的模式表示34-35
- 2.2 多元时间序列挖掘技术及应用35-49
- 2.2.1 聚类35-39
- 2.2.2 神经网络39-40
- 2.2.3 k-近邻40
- 2.2.4 相似性度量方法40-45
- 2.2.5 相似性查找方法45-46
- 2.2.6 参数化建模方法46-47
- 2.2.7 多元时间序列的应用研究47-49
- 2.3 金融多元时间序列挖掘技术49-56
- 2.3.1 时间序列聚类49-50
- 2.3.2 相似性查找方法50-53
- 2.3.3 模式挖掘53-54
- 2.3.4 小规模数据分析54-56
- 2.4 本文的研究重点和研究框架56-57
- 2.5 小结57-59
- 第三章 金融多元时间序列的相似性分析方法59-76
- 3.1 引言59-60
- 3.2 多元时间序列的相似性分析60-62
- 3.2.1 小规模数据60-61
- 3.2.2 相似性分析方法61-62
- 3.3 基于点分布特征的相似性度量62-68
- 3.3.1 多元时间序列的曲面图描述方式62-64
- 3.3.2 基于点分布特征的相似性度量64-68
- 3.4 方法验证与性能评估68-75
- 3.4.1 实验方式和评价方法68-69
- 3.4.2 REF数据的相似性查找69-71
- 3.4.3 EEG数据的相似性查找71-73
- 3.4.4 金融高频数据的聚类分析73-75
- 3.5 小结75-76
- 第四章 金融多元时间序列的平稳性分析方法76-100
- 4.1 引言76-78
- 4.2 时间序列平稳性分析方法78-81
- 4.2.1 时间序列聚类78-79
- 4.2.2 多元时间序列平稳性分析方法79-80
- 4.2.3 一元时间序列平稳性分析方法80-81
- 4.3 非线性转换理论81-86
- 4.3.1 非线性转换方法81-82
- 4.3.2 CCM的非线性趋势特征提取算法82-83
- 4.3.3 ACF的非线性趋势特征提取算法83-86
- 4.4 方法验证与性能评估86-98
- 4.4.1 一元仿真数据87-90
- 4.4.2 多元仿真数据90-93
- 4.4.3 多元股票数据93-94
- 4.4.4 参数化建模94-98
- 4.5 小结98-100
- 第五章 金融投资组合及多元时间序列预测100-113
- 5.1 引言100-101
- 5.2 金融资产选择方法101-104
- 5.2.1 金融时间序列101-102
- 5.2.2 金融投资组合模型102
- 5.2.3 金融资产选择方法102-104
- 5.3 投资组合模型104-106
- 5.3.1 基于聚类的资产选择方式104-105
- 5.3.2 一种新的金融时间序列特征提取方法105-106
- 5.4 方法验证与性能评估106-112
- 5.4.1 相关系数分析107-108
- 5.4.2 聚类分析108-110
- 5.4.3 多元时间序列的趋势预测110-112
- 5.5 小结112-113
- 第六章 金融高频数据的相似性查找方法113-132
- 6.1 引言113-114
- 6.2 金融高频数据分析114-115
- 6.3 金融高频数据的相似性查找方法115-122
- 6.3.1 金融高频数据的描述方法115-116
- 6.3.2 ACF多重非线性趋势特征的提取算法116-118
- 6.3.3 经验模式的确定方法118-121
- 6.3.4 相似性查找的评价方法121-122
- 6.4 方法验证与性能评估122-126
- 6.4.1 低频时间序列的相似性查找122-124
- 6.4.2 金融高频数据的相似性查找124-126
- 6.5 金融高频数据分析模块的框架126-130
- 6.6 小结130-132
- 第七章 总结与展望132-134
- 参考文献134-142