全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2636 5
2014-02-12



网上找到一篇无词典的分词算法介绍,展示的结果还算不错:

http://www.matrix67.com/blog/archives/5044


想请教,用sas可以实现该算法么?

求指点主要函数、过程......








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-2-13 11:29:00
找一天仔细看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-18 12:51:04
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-18 18:06:25
好东西,对于非结构的数据,文本的分词基础而又至关重要
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-22 23:17:51
爱萌 发表于 2014-2-18 12:51
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
应该不会算很新。

基于统计的语义识别应该有很多成果了……

这个方法好在门槛不高。编程经验稍多点应该可以用其它语言搞定,能找到python版本的。
------
我只会用sas粗爆的把 一起出现频率高的词提取出来,不会用文章介绍的 一些指标剔除无义词~~~相信有高手可以用sas实现这一过程。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-10 00:16:31
顶一下,正好有个项目作业要搞,我试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群