本人正在试图做关联分析中的频繁序列模式,欢迎高手前来指点,如果有人想与我一起做PrefixSpan算法也非常欢迎。附件是在网上找的一个程序,功能未能完全实现,现在考虑自己动手做。
这个附件虽然没有实现我要的功能,但从中还是学了点东西,我在程序中加了些注释,增加易读性。
附件的主要内容是:
定义类模板 template <class T> class PrefixSpan;通过调用类函数run,再调用类函数project并进行递归调用,来发现频繁序列;
主函数 int _tmain(int argc, _TCHAR* argv[])
输入文件 data.txt
输出文件 result.txt
输入文件内容:
(30) (90)
(10,20) (30) (40,60,70)
(30,50,70)
(30) (40,70) (90)
(90)
输出文件内容:
<pattern>
<fred>3</fred>
<what>(30)</what>
<where>0 1 3</what>
</pattern>
<pattern>
<fred>2</fred>
<what>(30) (90)</what>
<where>0 3</what>
</pattern>
<pattern>
<fred>3</fred>
<what>(90)</what>
<where>0 3 4</what>
</pattern>                                        
                                    
附件列表