摘要:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般 框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过 程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨 单-分类算法主要有NB算法、 ANN算法、 Rocchio算法、 KNN算法、 SVM算法等;组合分 类算法主要有两种组合算法,如 NB-KNN算法、 Rocchio-KNN算法、 KNN-SVM算法、 SVM-其它算法,还有多种组合算法.指出各种
机器学习算法应用在专利文本分类上的优 势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
原文链接:http://www.cqvip.com/QK/89454X/201603/669829336.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)