基于复杂网络的汉语相似词挖掘和相似度计算研究

801

收藏 2018-02-01

摘要：相似词是自然语言中普遍存在的现象，词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先，基于大规模语料库构建了汉语词汇共现网络，进而利用复杂网络结构中节点相似的思想来计算词汇的相似度。其次，基于分布假设、上下文语境理论和词汇网络结构的特点，本文提出了基于贡献度折扣的词汇相似度计算方法，该方法不仅考虑了网络边的权重信息，还将节点的全局度特征融合进来。通过节点相似度实验发现，本文提出的基于贡献度折扣的相似度算法要明显好于共同邻居法、Jaccard方法和Sahon方法。最后文章就实验结果及其结论做了详细分析。http://www.cqvip.com//QK/95888X/201508/667173125.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群