全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1916 1
2015-11-07
目前大三,跟着导师做毕业论文,导师让我用R进行数据分析,于是我就边自学R边推进论文了。大三还有不少课要上,所以没有时间能系统的学习R语言,只能需要什么学什么……所以问的问题可能比较小白,希望各位大神海涵。
下面是具体的问题:

我已经用hclust()对数据进行了聚类分析,现在需要计算每两个对象的聚类的提纯度。
所谓聚类的提纯度,就是任意的两个对象,被分到同一类时所在的dendrogram的高度占到dendrogram总高度的百分比。
hclust得到的结果中有一个merge矩阵,里面记录了聚类的步骤,有n个对象就有n-1步,每一步都有对应的高度height。有没有什么办法可以得到n个对象中任意两个对象被聚类到同一类时,是进行到了聚类的第几步?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-9 11:16:06
我自己又想了一个周末,感觉用cutree函数将聚类结果划分为1到n类,保存在一个n*n的矩阵m中,m的行表示每一个对象所在的类别,列表示被分为n类。
然后再从n类开始判断任意两个对象所处的类别是否相同,一直到发现相同为止。而n减去判断停止时的列的序数就是这两个对象第一次被分到同一类的聚类步骤。
具体的代码我还没有写,但是我感觉这个方法应该是可行的……但感觉这个方法非常原始,不知道有没有什么r package提供类似的功能
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群