基于VSM的科技期刊文献与专利文献的相似度计算方法研究

693

收藏 2017-10-27

摘要：文本相似度的计算方法以采用TF—IDF的方法对文本建模成词频向量空间模型（VSM）为主，本文结合科技期刊文献和专利文献特点，对TF—IDF的计算方法进行了改进，将词频的统计改进为科技术语的频率统计，提出了一种针对科技文献相似度的计算方法，该方法首先应用自然语言处理技术对科技文献进行预处理，采用科技术语的自动抽取方法进行科技文献术语的自动抽取，结合该文提出的术语权重计算公式构建向量空间模型，来计算科技期刊文献和专利文献之间的相似度。并利用真实有效}向科学期刊和文献数据进行实验测试，实验结果表明文中提出的方法优于传统的TF—IDF计算方法。

原文链接:http://www.cqvip.com//QK/72017X/201603/670999895.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群