全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6885 9
2016-12-05
placeheightwaterfallicesoildepthwindday
哈巴河

532.6

173.8

150

61.8

阿勒泰

735.1

191.5

146

37.7

克拉玛依

427

114.4

197

75.4

巴楚

1116.5

41.6

64

7.6

莎车

1231.2

42.5

93

11

于田

1427

46.4

81

1.4

hc.single=hclust(dist(xinj[,2:5]),method = "single")
plot(hc.complete,main = "Single Linkage",xlab="",labels=xinj$place,sub = "place",cex=.9)

Rplot.png
上面的语句只是对height这个参数进行了聚类,R语言如何对后面四个参数进行聚类分析呢?求大神解答,谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-12-5 22:50:45
数据没有标准化,没有消除量纲的影响,在这里height变量占主导作用,聚类是错误的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-6 11:03:42
飞天玄舞6 发表于 2016-12-5 22:50
数据没有标准化,没有消除量纲的影响,在这里height变量占主导作用,聚类是错误的。
能不能针对这个例子详细解答一下,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-6 14:25:57
天涯印象 发表于 2016-12-6 11:03
能不能针对这个例子详细解答一下,谢谢
把除了place变量外的变量标准化,用z-score和max-min都行,再做聚类进行了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-6 16:20:37
scale()函数进行标准化或中心化处理,sweep()函数进行极差标准化,这三种处理都可以
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-10 11:22:19
飞天玄舞6 发表于 2016-12-6 14:25
把除了place变量外的变量标准化,用z-score和max-min都行,再做聚类进行了。
感谢您的指导,这是我修改后的代码和图形,这个结果应该是正确的吧,还请指正,谢谢
xj<-xinj[,2:5]
xj2<-data.frame((xj$height-min(xj$height))/(max(xj$height)-min(xj$height)),
       ((xj$waterfall-min(xj$waterfall))/(max(xj$waterfall)-min(xj$waterfall))
        ((xj$icesoildepth-min(xj$icesoildepth))/(max(xj$icesoildepth-min(xj$icesoildepth))))
        ((xj$windday-min(xj$windday))/(max(xj$windday)-min(xj$windday)))))
xj2<-data.frame(xinj[,1],xj2)
xj2<-xj2[,2:6]
hc.single=hclust(dist(xj2[2:5]),method = "single")
plot(hc.single,main = "Single Linkage",xlab="",labels=xj2$xinj...1.,ylab="",sub = "place",cex=.9) xjjulei.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群