全部版块 我的主页
论坛 数据科学与人工智能 人工智能 人工智能论文版
551 0
2018-02-09
摘要:语料库为语言研究和自然语言处理提供基础数据服务.传统语料库数据缺乏规范的数据模型,导致无法科学的评价查询结果。大大降低了数据可用性.针对该问题,提出一种面向语料库的数据模型,并讨论了其上的查询问题.首先,给出语料库数据的形式化定义,其次,在关系模型的基础上提出一种面向文本语料库的数据模型,并证明了模型的完备性,在此基础上,扩展传统语料库以KWIC(Key WordIn Context)输出为中心的查询语义,定义了语料库数据的查询问题KWIC—EXTENTION.最后,证明这些查询问题的数据复杂度,其中,正匹配查询、负匹配查询、析取匹配查询、川临近匹配查询的数据复杂度是AC0的,临近正匹配查询的数据复杂度是PTIME(Polynomial Time)的,临近负匹配查询问题的数据复杂度是PSPACE(Polynomial Space)的.这些结论为语料库数据模型和查询方法的研究奠定了理论基础.

送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群