大家帮忙分析一下，我这么做是不是有点太不专业了？

1050

收藏 2013-03-08

苦于毕业一直纠结于论文，想做数据挖掘无奈没有好的数据。言归正传，我从电脑上下了1000个用户在一个月内的电脑日志数据包，文本挖掘不会做，没有办法就把日志数据导入了数据库，然后统计出日志记录每个焦点程序出现的次数，如果在一个月内出现的次数大于5，就默认用户经常使用这个软件，然后再对应的字段值设为“T”,否则“F”,这样形成如下表所示的的数据
pid 360se 360safe 360ie qq yy -----
1 F T F T F
2 F F T T F
这样用clementine作关联规则和分类预测，我怎么感觉有点太不专业了啊
web文本挖掘本有专业的工具，大家分析一下我这么做可以吗，毕业论文能通过不？