全部版块 我的主页
论坛 数据科学与人工智能 人工智能 人工智能论文版
584 0
2017-10-26
摘要:目前,很多最新的术语和专有名词,首先以字母词语的形式出现在汉语中,并日益广泛应用.而字母词语多数是汉语自动分词中的未登录词,其正确识别,将有助于提高中文分词、信息检索、搜索引擎、机器翻译等应用软件的质量.本文在对字母词语进行先期考察的基础上,分析了字母词语组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征和其独有的特点--字母串"锚点",提出了从中心往两边扩展的规则加统计辅助的字母词语自动提取的算法.并且对字母词语的双语同现问题进行了处理.算法简单,但有效.召回率为100%,准确率在80%以上.

原文链接:http://www.cqvip.com//QK/96983X/200502/15098558.html

送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群