文本分类中连续属性离散化方法的研究

635

收藏 2018-01-27

摘要：针对机器学习领域的一些分类算法不能处理连续属性的问题，提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法．该算法定义了一个离散化过程，离散化了采用传统信息检索的加权技术生成的非二值特征词空间，然后判断原特征空间中每个特征词属于或不属于某给定子区间，将问题转换成二值表示方式，以使得这些分类算法适用于连续属性值．实验结果表明，该算法离散过程简单高效，预测精度高，可理解性强．

原文链接:http://www.cqvip.com//QK/95659X/200911/32032688.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群