经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
H-K聚类
楼主
1528428009
1725
3
收藏
2016-08-11
最近在学习聚类这一块,有一个问题关于H-K(层次聚类-K均值)聚类的问题向大家请教。书上说由于K均值聚类的中心是随机选取的,因此需要多次迭代,而H-K聚类可以先用层次聚类确定聚类中心和数量,再用K-均值聚类。那么请问这两种方法是怎么结合到一起的呢,层次聚类是怎么确定聚类中心的,R代码又是怎么实现的
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
bbslover
2016-8-13 04:52:55
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
1528428009
2016-8-13 16:51:43
bbslover 发表于 2016-8-13 04:52
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
我知道用哪些包可以实现,我也知道操作,如果您知道答案请正面回答问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
bbslover
2016-8-13 23:48:39
正面回答,哈哈~
尝试回答一下:
而H-K聚类可以(1)先用层次聚类确定聚类中心和数量,(2)再用K-均值聚类。
你的问题的核心是:如何确定需要多少个cluster(这也是所有clustering算法最需要解决的问题,但是没有最好的办法)?而(1)说用hclust()帮助你得到所谓的cluster的数量,比如是3。然后你可以用3作为k-mean的输入[kmeans(x, centers = 3)],得到最终的聚类结果。
我想大体就是这样。
其实有很多办法来确定最优的cluster数目,但不能说哪个是最好的,都与你数据本身有关。
Good luck.
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
岭估计R代码
求R代码
求R代码,当Y值最小时,如何返回X值
R代码总提示“,”有错误,怎么回事 ,代码如下,求大神指教,谢谢!!
R语言的VAR代码和操作
【独家发布】一行R代码来实现繁琐的可视化
R代码小小的改进,请R语言朋友们帮忙
R代码:随机删除点线并计算网络指标
R代码求助
【独家发布】R代码执行结束后自动通知的一个简单的办法
栏目导航
R语言论坛
金融类
经管文库(原现金交易版)
运营管理(物流与供应链管理)
经管高考
论文版
热门文章
CDA 数据分析师:特征处理核心指南
电子行业深度报告:量子深潜-计算篇:从比特 ...
制造业全要素生产率(2000-2024年)
从知识图谱到认知智能
中物联:全球供应链发展趋势蓝皮书(2025)
企业降低融资成本白皮书(2025)
2025年最值得关注的公司-放射配体创新者开启 ...
中国能源统计年鉴1986-2023
签个到
安永2025年全球财务主管DNA调查(英)
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群