摘要:以往的词汇搭配抽取统计评价方法具有大致相同的效果,它们各有优劣,可以实现优势互补。该文提出多策略融合的搭配抽取方法。首先,将互信息法用于衡量二元独立性,淘汰候选的无关二元组。其次,对比χ^2检验法与t检验法,发现使用χ^2检验法能够更合理地反映搭配组合的同现性和期待性;然后,使用对数似然比检验法,解决其他方法无法克服的稀疏数据问题。此外,加入构词法的启发式规则,最终形成一个多策略融合的方法。实验结果表明该方法的准确率较高,在实际应用中取得良好效果。
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)