摘要:本文提出了一种基于小规模语料库和机器可读词典(Machine Readable Dictionary,MRD)的无指导的动词语义获取方法.该方法不需要使用有义项标注的语料库,而是使用从语料中获得的v+N搭配以及MRD中多义词定义的应用实例中获得的知识.使用两种方法解决数据稀疏问题:首先,将词的相似性度量由直接共现扩展到共现词的共现,以共现聚类而不是共现词来计算词的相似度.其次,从MRD定义中获取名词的IS-A关系.通过这些方法,即使两个词不共享任何词,也可认为是相似的.实验表明,该方法可从很小规模的语料中获取知识,并在不限制词义的情况下达到85.7%的正确排歧率.
原文链接:http://www.cqvip.com//QK/96983X/200406/10695853.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)