全部版块 我的主页
论坛 数据科学与人工智能 人工智能 人工智能论文版
484 0
2017-10-29
摘要:在使用计算机处理中文信息时,对词语的自动化发现技术有迫切的需求。因为在互联网时代,词语集合的更新换代非常之快,词语以非常快的节奏产生和消亡,这直接影响着对中文信息自动化处理的准确度和可靠性。为了解决这个难题,本文提出一种基于词激活力模型的中文词语发现方法。该方法将海量汉语语料建模成为有序的汉字序列,建立词激活力模型,分析字与字之间的联系程度,从而对任意两个汉字是否构成词语进行估计。在大规模语料集上的数据实验表明,该方法能够有效地对预料中的潜在词语进行自动化发现,达到了预期目标。

原文链接:http://www.cqvip.com//QK/94352X/201212/44516669.html

送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群