全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2386 6
2010-06-12
请问0 、1数据和连续性数据是否应分开聚类,如分开0、1数据在SAS中用什么过程聚类?另连续性数据聚类,距离类型怎么选择?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-6-12 14:10:05
请大家帮忙!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-15 00:05:46
0 、1数据和连续性数据,都转换成距离就行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-15 09:22:39
2# xgnfly
0 、1数据和连续性数据均可采用相同的聚类方法:谱系聚类,类间距离有多种定义,比如类平均法(METHOD=AVERAGE)、重心法(METHOD=CENTROID)、最长距离法(METHOD=COMPLETE)、最短距离法(METHOD=SINGLE)、密度估计法(METHOD=DENSITY)、Ward最小方差法(METHOD=WARD)。
示例如下:
proc cluster data=原数据集 method=ward outtree=谱系聚类树数据集 pseudo ccc;
var var1 var2 ...;
copy species; /*COPY语句把指定的变量复制到outtree=的数据集中*、
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-15 17:45:04
tj0412ymy 发表于 2010-6-15 09:22
2# xgnfly
0 、1数据和连续性数据均可采用相同的聚类方法:谱系聚类,类间距离有多种定义,比如类平均法(METHOD=AVERAGE)、重心法(METHOD=CENTROID)、最长距离法(METHOD=COMPLETE)、最短距离法(METHOD=SINGLE)、密度估计法(METHOD=DENSITY)、Ward最小方差法(METHOD=WARD)。
示例如下:
proc cluster data=原数据集 method=ward outtree=谱系聚类树数据集 pseudo ccc;
var var1 var2 ...;
copy species; /*COPY语句把指定的变量复制到outtree=的数据集中*、
run;
我指的距离是欧氏距离、明氏距离、标准化的欧氏距离和马氏距离等如何指定,谢谢!
欧氏距离
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-15 17:46:59
3# chouxiangdaishu

请详细点,是标准化还是其它方法,最好能给出一个小例子。多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群