1 论文标题:基于分形理论的股票时序数据离群模式挖掘研究
2 作者信息:孙金花, 哈尔滨工业大学技术政策管理国家哲学社会科学创新基地,博士研究生, 主要研究方向为环境绩效管理理论与方法
3 出处和链接:运筹与管理,期刊(2008年10月)
4 摘要
针对股票时间序列的特点, 从离群点对股票时序数据有序性的影响角度出发, 在界定分形离群点含义的基础上, 利用分形理论将离群模式挖掘理解为一个优化分割问题。采用推广G􀀁P ( Grassberger􀀁Procaccia)算法计算股票时间序列数据集的多重分形广义维数, 并利用贪婪算法的思想设计了FT􀀁Greedy 算法来求解基于分形理论的时间序列离群模式挖掘优化问题的解集。实验证明, 该方法能有效地解决股票时间序列离群模式挖掘问题。
离群点检测是一种从海量数据集中搜寻少量异常知识的过程, 它要求算法具有良好的时间与空间效率。这篇文章构造的基于分形理论的离群点检测算法考虑了离群点在时序数据集中的分布特性和线性的时间与空间上的复杂性。文章中通过在上证指数收盘点数时序数据集测试发现, FT- greedy 算法效率较高, 既可以用于时间序列离群点的快速发现, 也可以作为风险预测, 为进一步的数据集知识发现提供依据。
一般文章都是讨论均值的,讨论异常值的少之又少,这就是我为什么对这篇文章感兴趣, 欢迎大家一起讨论