摘要:对非结构化网络中有价值信息数据挖掘的研究,可更好的提升非结构化海量网服务质量。采用当前方法进行数据挖掘时,需要对信息数据先进行降噪,但降噪过程较为复杂,挖掘方法局限性大。提出基于关联规则的非结构化网络中有价值信息数据挖掘方法。利用特征提取方法对文本特征进行初步的分类与识别,提取不同文本类型的特征,利用关联规则方法计算各个类型特征间的关联度,将不同文本类型特征中较为明显的词作为聚类的对象,搜索出在给定样本数据上具有最大后验概率的文档划分方案,将每个文档信息作为其类别形成的随机符号序列,采用最大似然估计计算出各个符号的频率分布,利用计算的结果完成对信息数据挖掘。仿真结果表明,所提方法可扩展性较强,可以有效地完成对非结构化网络中有价值信息
数据挖掘。
原文链接:http://www.cqvip.com//QK/92897X/201702/671296829.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)