全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1668 2
2014-03-11
在cluster包中,用agnes做层次聚类的时候,会有一个指标agglomerative coefficient (AC) 和一个banner的图
这两个东西的用处想了很久没想明白
只是感觉banner图貌似是聚类过程的另外一种描述,类似冰挂图,但又不一样,这个图的优势在哪里?
大神帮帮忙,解释下这个指标吧,再帮忙解读一下这个banner图吧
叩谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-11 22:46:45
http://www.unesco.org/webworld/idams/advguide/Chapt7_1_4.htm上面有详细的说明。简单而言,AGNES也属于分层聚类,就是先认为数据中没有给观测为一类,然后计算类之间的相异度。而相异度的定义在链接里有,如两个类Q和R的距离d(Q ,R)。
其次,关于AC系数的计算,首先定义d(i)是第i个观测与第一次聚类得到的类的距离和最后一次聚类两个类的距离之比,然后对所有d(i)做平均得到1-AC。AC系数反映了数据结构,如果原始数据很明显的分成了多个类,那么显然AC系数会很大。
关于最后的banner图,你可以这么看。你假设有一条竖线从右向左沿着横轴移动,随着竖线的移动,这条线会接触到banner图上的空白条,若竖线与一条空白条垂直,那么这个空白条就将所有数据分成两类。随着竖线向左移动,竖线会与两条空白条垂直,那么这两条空白条就将所有数据分成三类,以此类推……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-12 18:51:04
wtxhpx1991 发表于 2014-3-11 22:46
http://www.unesco.org/webworld/idams/advguide/Chapt7_1_4.htm上面有详细的说明。简单而言,AGNES也属于分 ...
非常感谢,基本明白了,我主要是对链接里的说明,看了半天也没看太明白,英文不习惯
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群