摘要:提出了一种基于扩展语义向量的特征表示方法,利用机器学习的方法来解决基因提及标准化中的消歧问题.首先应用高性能的命名实体识别系统识别文献中的基因提及;其次采用不同的搜索策略生成候选结果;再次以扩展语义信息作为特征用
机器学习的方法进行消歧;最后利用Wikipedia构建后过滤器对候选结果进行过滤处理.在Biocreative Ⅱ GN任务测试集上的试验表明,该方法的F值达到了83.2%.
原文链接:http://www.cqvip.com/Main/Detail.aspx?id=35528610
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)