摘要:共现词提取在信息挖掘和自然语言处理中有着十分重要的地位.而传统的共现词提取方法仅仅局限在单一的一种统计量上,其结果十分不精确,需要人工再进行整理.本文提出了一种基于词汇吸引与排斥模型的共现词提取算法,并通过将多种常用统计量进行组合,改进了算法的效果.在开放测试环境下,所提取的共现词其用户感兴趣度为60.87%.将该算法应用于基于Web的共现词检索系统,在速度和共现词的提取精度上均取得了比较好的效果.
原文链接:http://www.cqvip.com//QK/96983X/200406/10695852.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)