基于非对称相似度的文本聚类方法

805

收藏 2018-02-18

摘要：文本聚类具有数据稀疏性的特点，常见的聚类方法采用基于距离的相异度，为了增强文档的区分特征，提出一种基于非对称相似度的方法，来度量文档对象之间的关联。定义了文本对象之间的非对称相似度度量。利用文本非对称相似度矩阵的稀疏特性，采用强连通构件的划分方法对文本对象进行聚类分析。并通过迭代的方法形成聚类结果的概念层次。实验结果表明：非对称相似度比距离相异度具有更高的准确率和更少的执行时间，当聚类结果簇数目达到较小时，准确率提高约为20％。

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群