全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1629 8
2013-08-03
如附件所示,这是网上找的一个做中文文本挖掘的一个例子,前面是文本,后面是对这个文本的分类,譬如第一个
仅售25元!原价最高70元的北京剧院电影票通票一张,不限场次,不限时间,所有影片通看(含3D)!邀请好友返利10元!        2


后面的2就是对这个文本的一个分类。

请问,这种数据怎么读到sas或者R里面去哪?谢谢

附件列表

test.txt

大小:37.27 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-8-3 23:40:45
高端
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-4 09:56:05
求高手解惑.....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-4 14:24:52
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-4 15:15:33
boe 发表于 2013-8-4 14:24
厉害 高手 多谢多谢 请问一下,sas在读取这个的时候怎么读的 能指导一下吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-8-4 15:38:56
hamsik11 发表于 2013-8-4 15:15
厉害 高手 多谢多谢 请问一下,sas在读取这个的时候怎么读的 能指导一下吗?
1,原文件有点编码的问题;
2,分隔符不统一,所以就一下子读完;由于只有两个变量,比较容易处理;
3,具体来说,原文件的每一行都变量text的值,然后据此确定变量flag的值;
4,有点投机,或许有更好的方法,比如把分隔符先处理一下;
5,见识到很多的促销手段,对练摊很有帮助,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群