摘要:为实现根据HTTP 协议数据流对用户的行为进行分析,需要快速区分出用户访问 资源的URL .为此文章提出-种结合规则过滤和机器学习算法的方法,用于快速识别用户访 问的URL .首先将解析后的数据包根据URL 后缀过滤掉资源加载类的数据包,然后根据浏览 器 UserAgent的特有字段和在浏览器上访问网页的特性识别出浏览器UserAgent,最后通过基于 AdaBoost和 Bayse算法训练好的分类器识别出用户访问URL .实验结果表明,本文方法能够在 局域网数据流中高效、准确的识别出用户访问的URL .
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)