摘要:提出一个面向教学的Web页面自动分类的框架,并详细叙述了这一框架的实现.重点在于页面元数据的提取,页面特征的选取和量化.系统采用基于决策树的分类方法,采用C4 5
机器学习算法,通过对大量人工标注页面的学习形成分类规则,并利用链接相关性对分类结果进行优化,以提高精度.
原文链接:http://www.cqvip.com//QK/95200X/200208/6563297.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)