全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6009 5
2012-06-03
下了个带text miner 5.1 的版本,sid中不含中文模块,不过有困难也要上不是!小弟这样想:既然sas只能对英文进行解析,那么可不可以先用分词包将中文分好词,然后将每个词用拼音代词,词与词之间用空格分开。这样text miner看到拼音就能把它当作英文了,然后就可以进行聚类、分类等一系列工作。

不知这种想法可行不可行?求高手鉴定!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-6-3 23:34:28
同求
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-4 00:18:42
关注
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-4 00:35:56
已经测试!这种方法是可以的!只不过最终看结果时是用拼音显示的,会很让人抓狂……

另外,分词我用的java包是IKAnalyzer,中文转拼音的java包是pinyin4j。pinyin4j这个包挺好用的,就是对于一些词组和多音字无能为力,很是头大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-6-11 11:31:01
邮编无忧网 对中文地址进行模糊匹配 算text mining 吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-9 21:59:44
sas ccs 中有中文配套的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群