关于文本聚类 - 经管之家

› 论坛 › 提问悬赏求职新闻读书功能一区 › 经管百科 › 爱问频道

关于文本聚类

1256

4

收藏 2013-02-13

出自论文： Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections【1992】←google学术上可搜索到
page 322
1)在"4 Definitions"中，提到"let V be the set of unique words occuring in C",是怎么发现那些unique words 的呢？
2)比较两篇文章用了两篇文章的字符出现频率向量的余弦，可是，如果两篇文章的特殊字符(unique words)是不同的怎么办？这个余弦的计算难道要把全部进行分类的文章的所有关键字先统计下么？

英语文章读起来真是各种抓狂，坐等高人解答……

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2013-2-26 08:56:53

呵呵，顶起，求高手解决

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2013-3-1 17:53:54

数据挖掘类题目？

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2013-3-1 20:58:57

数据挖掘啊~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2013-3-3 22:31:06

额就是找了篇论文读了下，然后没读懂，于是决定把问题甩到论坛上，然后暂时抛弃它

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群