全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2159 8
2013-04-22
悬赏 1 个论坛币 已解决
请问sas聚类有没有可以直接在菜单上点击的,不用写代码的?
另外在代码中有 maxclusters,和 maxiter 和 drift 分别表示什么呢?
比如:
maxclusters=3 maxiter=100 drift;

我怎么才知道大概要聚出几类?


最佳答案

hamsik11 查看完整内容

参考sas help上proc fastclus上的第二个例子,就是用cluster analysis来去异常值的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-4-22 13:40:00
lovelybetty1208 发表于 2013-4-22 18:42
我看了 ccc的值确实是一个很大的负值,请问有什么办法去掉outlier?
参考sas help上proc fastclus上的第二个例子,就是用cluster analysis来去异常值的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-22 15:43:45
ding
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-22 17:20:36
ding
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-22 17:51:32
MAXCLUSTERS就是指定最大聚类的个数
因为proc fastclus采用的k-means算法,所以要迭代直到收敛为止,maxiter用来指定迭代最大次数。
drift这个就是改变核心的位置,你查查sas help就知道了。

至于大概聚出几类,得看Cubic Clustering Criterion的值。
Values of the cubic clustering criterion greater than 2 or 3 indicate good clusters.
Values between 0 and 2 indicate potential clusters, but they should be taken with
caution; large negative values may indicate outliers.
实际情况得看你项目的要求
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-22 18:42:35
hamsik11 发表于 2013-4-22 17:51
MAXCLUSTERS就是指定最大聚类的个数
因为proc fastclus采用的k-means算法,所以要迭代直到收敛为止,maxit ...
我看了 ccc的值确实是一个很大的负值,请问有什么办法去掉outlier?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群