全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3782 0
2020-12-01
使用K均值聚类算法计算聚类中质心的步骤
在此博客中,我将详细介绍K-means方法,并说明如何计算质心和数据点之间的距离以形成聚类。
考虑下面的数据集,该数据集具有特定图形上的数据点的值。
表格1:
我们可以随机选择两个初始点作为质心,然后从那里开始计算每个点的距离。
现在,我们将D2和D4视为质心。
首先,我们应该借助欧几里得距离来计算距离
                                                           √((x1-y1)2+(x2-y2)2
迭代1:
步骤1: 我们需要计算初始质心点与其他数据点之间的距离。下面,我显示了距数据点D1的初始质心D2和D4的距离的计算。
在计算所有数据点的距离之后,我们得到以下值。
表2:
第2步:接下来,我们需要对距离中心点较近的数据点分组。观察上表,我们可以注意到D1距离D4越近,距离越近。因此我们可以说D1属于D4。同样,D3和D5属于D2。分组后,我们需要从表1计算分组值的平均值。
群集1:(D1,D4)群集2:(D2,D3,D5)
步骤3:现在,我们计算创建的聚类的平均值,新的中心值将这些平均值和质心沿图形移动。
从上表中,我们可以说群集1的新质心是(2.0,1.0),群集2的新质心是(2.67,4.67)
迭代2:  
步骤4:再次根据新的百分位数计算出欧几里得距离的值。下表是数据点和新质心之间的距离表。
现在我们可以注意到群集已经更改了数据点。现在,群集1具有D1,D2和D4数据对象。同样,集群2具有D3和D5
步骤5:根据我们在步骤3中执行的表1计算新聚类组的平均值。下表将显示平均值
现在,我们有了新的质心值,如下所示:
群集1(D1,D2,D4)  -(1.67,1.67)和群集2(D3,D5)-(3.5,5.5)
必须重复此过程,直到找到质心的常数,并且最新的聚类将被视为最终的聚类解决方案。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群