有一份新闻内容的文本数据需要先做聚类,
聚类后用cutree查看分类情况,想把得出的新闻的类别加入到另一份用户浏览过新闻的数据中,
但是用户的新闻数据有重复项,该如何导入是用户新闻数据中能多一列显示新闻的类别?然后还要变成向量,每个用户间做余弦乘积,算余弦相似性,这又怎么写啊?还要选出与每个用户最相似的5个,提取出这五个人中共同看过且原用户没看过的最新的新闻。R新手,完全没思路啊...... 希望各位大神能写的具体些,给个大方向还是不太懂啊,时间紧任务重,望各路神仙都帮帮忙啦~~~~  小女子先在此谢过!