各位大侠:
请教一下关于对比挖掘中“显露模式”挖掘方法的应用问题,
第一个疑问:根据显露模式的原理,是寻找两个类之间有差异的项集,那是否在做显露模式的时候只能做两个数据集中的差异比较,比如说对于地区的数据,是否我只能把地区的数据分为两个部分,如南、北方两个数据集,而不能同时比较三个数据集,但是地区有时根据研究需要不仅仅是只划分为两类,如把地区分为南、北、中三类,那显露模式能不能同时挖掘多个类之间有差异的项集呢?
第二个疑问:对于显露模式,假设我的数据集类型为男性数据集和女性数据集两种,这两个数据集中的病例均对应各种细菌病原的检查,如金葡菌、流感杆菌、军团菌等,但是每个病例并不是都会做上面的所有细菌的检查,可能某一个病例只做了金葡菌的检查,结果是阳性,但是其它两种细菌他没有做检查所以就不会有检查结果,对于没有检查的细菌,我在纳入显露模式的分析时,数据怎么整理比较好呢?或者说对于没有检测的病原我就让那个值为空白或缺失,行吗?
第三个问题:显露模式是不是只能用C++语言实现分析,能不能有其它的软件,比如说SAS软件实现算法?
在此感谢各位大侠,期待您的热心帮助,感激不尽!!!