苦于毕业一直纠结于论文,想做数据挖掘无奈没有好的数据。言归正传,我从电脑上下了1000个用户在一个月内的电脑日志数据包,文本挖掘不会做,没有办法就把日志数据导入了数据库,然后统计出日志记录每个焦点程序出现的次数,如果在一个月内出现的次数大于5,就默认用户经常使用这个软件,然后再对应的字段值设为“T”,否则“F”,这样形成如下表所示的的数据
pid 360se 360safe 360ie qq yy -----
1 F T F T F
2 F F T T F
这样用clementine作关联规则和分类预测,我怎么感觉有点太不专业了啊
web文本挖掘本有专业的工具,大家分析一下我这么做可以吗,毕业论文能通过不?