摘要:熟语是自然语言中普遍存在的语言现象.本文分析了国内现有语料库对熟语的标注方式,发现这种方式对语料库的进一步加工是有问题的.为了在语料库标注阶段把熟语问题处理好,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴,进而提出根据固定语的语法功能给定词性标记,再根据它们的词汇特征给定词汇范畴标记的双层标记法,这样在一定程度上解决了熟语的语料库标注问题.
原文链接:http://www.cqvip.com//QK/96983X/200401/8868967.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)