基于组块的中文自动文摘系统研究

535

收藏 2017-10-29

摘要：传统的基于统计的自动文摘方法以词语作为文本信息的基本单位。没有考虑到词语在不同语言环境下的具体语义，导致文摘精度不高。为了克服传统方法的缺点，提出了一种基于文本组块的自动文摘方法。系统利用中科院的ICTCLAS软件对文档进行分词和词性标注。并根据一系列的规则，将相关的词语构造成组块。由句子中出现的组块作为衡量句子重要性的标准选出文摘句。文中给出了自动文摘的评价方法和实验结果。跟传统的基于词语的文摘相比较，实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高．更能全面反映原文的主要内容。

原文链接:http://www.cqvip.com//QK/97941X/200703/23868150.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群