全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3994 4
2015-09-22
我的一个sas聚类分析的小程序
/*导入数据*/  
proc import out= work.data
            datafile= "D:\sascode\data.xls"
            dbms=excel replace;
     range="sheet1$";
     getnames=yes;
RUN;

/*聚类分析*/                                                                                                                           
proc cluster data=work.data method=ward outtree=data1 std nonorm rsquare ccc;
var x1-x3;
id id;
run;

/*谱系图*/                                                                                                                              
proc tree data=data1 out=out1 horizontal n=5 graphics;
id id;
run;

数据量很大,我想将数据变量分成几类,也就是Q型,以表格的形式呈现,而不是tree,因为数据量大,看不清楚,请问程序应该如何撰写?以前用sas不多,特来请教,谢谢帮助

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-9-22 23:13:30
而且在程序运行里提示说WARNING: MAXCLUS option value 200
不知道应该怎么处理,感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-25 23:20:56
不应该用proc cluster过程,proc cluster是层次聚类法,一般适合观测小于100的聚类,能够生产树状图,由于观测少所以可以清晰看出聚类过程;应该使用proc fastclus过程,该过程是快速聚类法,适合大数据集,不能生成树状图,通过指定输出数据集,里面有各个观测的分类。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-27 20:16:20
先利用主成分分析,压缩变量,然后标准化数据,然后proc fastclus,最后在proc cluster和proc tree
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-28 09:39:36
proc cluster 的 OUTTREE=  选项可以输出到数据集
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群