全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5109 11
2014-09-25
大家好,我用R语言做主题模型的时候,可以得到每个文本的Top5的关键字,现在想利用关键字对文本分类。
举例说明就是:
现假设有5个文本,每个文本的类别已知,分别是IT,汽车,金融,旅游,招聘
利用主题模型处理后,得到每个文本的Top5关键字分别是
1               2            3        4          5
新浪      丰田      证券     长城    大街网
百度      奔驰      银行      古城   简历
.....
.....
现在我想自动匹配一下,根据关键字把文本划分到对应的类别中,不知道该怎么做,还希望有想法的人能帮忙提供一下思路
谢谢~~~~~~~~~

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-9-25 20:19:53
用主题模型处理后,还不知道该怎么做?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-26 09:39:43
olympic 发表于 2014-9-25 20:19
用主题模型处理后,还不知道该怎么做?
我刚接触R,是真的不知道该怎么继续下去,如果你知道,能指点一下我吗?感激不尽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-26 10:35:40
顶一顶
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-26 12:24:37
张群0703 发表于 2014-9-26 09:39
我刚接触R,是真的不知道该怎么继续下去,如果你知道,能指点一下我吗?感激不尽
> 根据关键字把文本划分到对应的类别中
这是要划分新文本的类别?

好像比较简单的办法是分配权值,匹配已知类别的关键字时候累加权值。
遇到“简历&证券”时,可能是金融招聘方面的文本。
稍复杂点的模型一般带解码器之类的,不知道你用的哪个主题模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-26 13:35:13
olympic 发表于 2014-9-26 12:24
> 根据关键字把文本划分到对应的类别中
这是要划分新文本的类别?
我用的是LDA模型。是要分配到已知的类别中。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群