使用K均值聚类算法计算聚类中质心的步骤

3863

收藏 2020-12-01

使用K均值聚类算法计算聚类中质心的步骤
在此博客中，我将详细介绍K-means方法，并说明如何计算质心和数据点之间的距离以形成聚类。
考虑下面的数据集，该数据集具有特定图形上的数据点的值。
表格1：
我们可以随机选择两个初始点作为质心，然后从那里开始计算每个点的距离。
现在，我们将D2和D4视为质心。
首先，我们应该借助欧几里得距离来计算距离
                                                         √（（x1-y1）2+（x2-y2）2
迭代1：
步骤1：我们需要计算初始质心点与其他数据点之间的距离。下面，我显示了距数据点D1的初始质心D2和D4的距离的计算。
在计算所有数据点的距离之后，我们得到以下值。
表2：
第2步：接下来，我们需要对距离中心点较近的数据点分组。观察上表，我们可以注意到D1距离D4越近，距离越近。因此我们可以说D1属于D4。同样，D3和D5属于D2。分组后，我们需要从表1计算分组值的平均值。
群集1：（D1，D4）群集2：（D2，D3，D5）
步骤3：现在，我们计算创建的聚类的平均值，新的中心值将这些平均值和质心沿图形移动。
从上表中，我们可以说群集1的新质心是（2.0，1.0），群集2的新质心是（2.67，4.67）
迭代2：
步骤4：再次根据新的百分位数计算出欧几里得距离的值。下表是数据点和新质心之间的距离表。
现在我们可以注意到群集已经更改了数据点。现在，群集1具有D1，D2和D4数据对象。同样，集群2具有D3和D5
步骤5：根据我们在步骤3中执行的表1计算新聚类组的平均值。下表将显示平均值
现在，我们有了新的质心值，如下所示：
群集1（D1，D2，D4）  -（1.67，1.67）和群集2（D3，D5）-（3.5，5.5）
必须重复此过程，直到找到质心的常数，并且最新的聚类将被视为最终的聚类解决方案。
题库

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群