全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 经管代码库
1916 1
2015-02-13
      聚类分析方法(观测值聚类)的选择细节特别多,下面是根据手册总结出的结果,供参阅。
method=指定方法:一般会根据观测值多少(size)、形状(shape)、离散性(dispersion)来综合判断使用什么方法;


1)K-means和ward倾向于每个类中有相同的观测值。
2)average倾向于聚的类具有相同的方差;
3)非参模型single、twostage和density系列的方法倾向于不规则的图形。
4)Centroid(质心)对异常值比较稳健。

      一般来说可以分成下面几类是常用的,如果聚类特征特别好,哪种方法基本上没有什么区别。






1、类间界限不清晰的情况,一般使用twostage(调整k)和ward的方法




复制代码

1.png


2、不同观测值和离散性的多元正态(twostage(调整k)、single)




复制代码



2.png


3、细长型的数据分布(twostage(圆形区域内聚类)、结合aceclus(细长型的聚类))




复制代码



3.png


4、Nonconvex聚类(centroid、twostage(调整k扑捉非线性趋势))




复制代码


4.png



       不规则图形还是要看需要扑捉到什么图形,一般可以在非参的一类方法中,调整参数达到目的
以上均是2个变量的间的散点图,如果需要绘制多变量简单的图形,一般通用的做法是绘制典型变量的图形
       在SAS中一般会结合典型判别过程进行处理。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-12 19:06:09
好贴啊好帖,学习中,支持!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群