摘要:分类就是为给定的输入选择正确的类标签。在基本的分类任务中,每个输入被认为是与其他的输入隔离的,并且标签集是预先定义的。所以文本分类就是根据预先定义的主题类别,按照一定的规则将文档集合中未知类别的文本自动确定一个类别,它涉及到数据挖掘、计算语义学、信息学、人工智能等个学科,是自然语言处理的一个重要应用领域。目前,越来越多的统计分类方法、机器学习方法、
数据挖掘技术和其它的新技术被应用到文本自动分类领域中,同时基于Python自然语言处理的文本分类研究在目前也得到广泛应用。
原文链接:http://www.cqvip.com/QK/96621X/201607/669539274.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)