经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
H-K聚类
楼主
1528428009
1783
3
收藏
2016-08-11
最近在学习聚类这一块,有一个问题关于H-K(层次聚类-K均值)聚类的问题向大家请教。书上说由于K均值聚类的中心是随机选取的,因此需要多次迭代,而H-K聚类可以先用层次聚类确定聚类中心和数量,再用K-均值聚类。那么请问这两种方法是怎么结合到一起的呢,层次聚类是怎么确定聚类中心的,R代码又是怎么实现的
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
bbslover
2016-8-13 04:52:55
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
1528428009
2016-8-13 16:51:43
bbslover 发表于 2016-8-13 04:52
有很多package做这两种聚类分析。如果你要学习内部操作,首先你要懂得算法原理。
我知道用哪些包可以实现,我也知道操作,如果您知道答案请正面回答问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
bbslover
2016-8-13 23:48:39
正面回答,哈哈~
尝试回答一下:
而H-K聚类可以(1)先用层次聚类确定聚类中心和数量,(2)再用K-均值聚类。
你的问题的核心是:如何确定需要多少个cluster(这也是所有clustering算法最需要解决的问题,但是没有最好的办法)?而(1)说用hclust()帮助你得到所谓的cluster的数量,比如是3。然后你可以用3作为k-mean的输入[kmeans(x, centers = 3)],得到最终的聚类结果。
我想大体就是这样。
其实有很多办法来确定最优的cluster数目,但不能说哪个是最好的,都与你数据本身有关。
Good luck.
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
岭估计R代码
求R代码
求R代码,当Y值最小时,如何返回X值
R代码总提示“,”有错误,怎么回事 ,代码如下,求大神指教,谢谢!!
R语言的VAR代码和操作
【独家发布】一行R代码来实现繁琐的可视化
R代码小小的改进,请R语言朋友们帮忙
R代码:随机删除点线并计算网络指标
R代码求助
【独家发布】R代码执行结束后自动通知的一个简单的办法
栏目导航
R语言论坛
休闲灌水
真实世界经济学(含财经时事)
数据分析与数据挖掘
产业经济学
劳动经济学
热门文章
表格结构数据的核心特征及具象实例解析
2026中信里昂风水指数
毕马威 - 中国内地与香港IPO市场2025年回顾 ...
2026年中国白银行业市场供需现状及发展趋势 ...
高教现代数学基础23 矩阵计算六讲 徐树方,钱 ...
求Journal of Computational and Graphical ...
查找文献Digital mapping of soil organic ...
《技术的本质》epub版本
精准匹配,菁英相伴--经管之家单身俱乐部, ...
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群