2019/12/14
《No.13: p107-p113》《增强型分析-AI驱动的
数据分析、业务决策与案例实践》读书笔记
第4章 序列分析
4.5 序列预测的挖掘以及应用
序列预测(Sequential Prediction): 就是预测给定序列中下一个项,序列预测也称为Sequence Labeling。
4.5.1 序列规则与序列预测的关系: 都是应用过往的历史数据进行学习。
1.序列规则: 客户目前的行为可以被规则覆盖,且置信度高;找出共有模式(满足支持条件下)发生概率较高的规则。
2.序列预测: 通过学习找到在已知序列的情况下,预测下一个事件为何?
4.5.2 序列预测算法的介绍
1.隐马尔可夫模型(Hidden Markov Model,HMM),
1)应用隐序列来预测观察量,在词性标记、语音识别等领域被广泛使用。也运用在DNA测序。
2)应用前提: 使用的场景符合其基本要求(未来一系列可能状态的概率仅仅依赖于前一状态)
2.其他算法: CPT(Compact Prediction Tree)的算法优于隐马尔可夫模型,
4.5.3 示例: 客户下一步会做什么?
1.CPT算法是一种无监督的学习过程。
2.用Kaggle上的Acquire Valued Shoppers Challenge的数据集作为数据源,同时使用SPMF开源算法库实现CPT算法。