全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1690 2
2013-07-31
我用爬萌软件抓取的微博数据,格式如下
var1 var2 var3
1     你好  @小明
2     我好  @小刘,@小张,@小明
3     他好  
4     嘿嘿  @小张
5     呵呵  @小刘,@小明
6     哈哈
.........

数据结构如上文所示,现在我想统计此人微博@最多的频率,求问用SAS程序该怎么写

我写的如下,但是显然是错误的:
%let data=sasuser.cm;
%let var=var3;
proc freq data=&data order=freq ;
tables &var;
run;


哪位大神指点一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-31 13:27:26
大概写了个整理数据至规范型式的代码,见下
随后的分析用各种统计过程就方便了

data have;
informat id 8.;
informat content $500.;
input id name $ content $;
datalines;
1 小张 @小王,@小李,@小赵
2 小王 @小李,@小张
3 小林 @小周
;
run;

data want(drop=i content);
set have;
do i=1 to COUNT(content,'@');
name_at=SUBSTR(SCAN(content,i,','),2);
output;
end;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-31 15:13:20
playmore 发表于 2013-7-31 13:27
大概写了个整理数据至规范型式的代码,见下
随后的分析用各种统计过程就方便了
哈哈哈哈  太谢谢您了  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群