什么是 KMeans 聚类算法?
KMeans 聚类算法是将对象分类为多个组的过程,以便它们在一个组之间尽可能地不同,而在每个组内尽可能地相似。KMeans 聚类是一组相似的事物或数据。例如,下图中显示的组 1(集群 1)中的对象应尽可能相似。
但是第 1 组和第 2 组中的对象应该有很大差异。
对象的属性决定了哪些对象应该被组合在一起。此方法用于查找未在数据中明确标记的组,可用于确认业务对存在哪些类型的组的假设,或识别复杂数据集中的未知组。运行算法并定义组后,任何新数据都可以轻松分配给正确的组。
企业如何使用 KMeans 聚类算法分析数据?
为了了解如何最好地利用这个算法;让我们看一些一般示例,然后是一些业务用例。
银行的贷款申请人可能会根据申请人年龄、年收入、工作期限、贷款金额、拖欠付款的次数等分为低、中、高风险申请人。
电影票预订网站可以根据过去的电影票购买情况将用户分为经常购票者、中度购票者和偶尔购票者。
KMeans 聚类可以通过购买历史来细分客户,通过他们在网站上执行的活动来细分用户,根据兴趣定义人口统计资料,并识别市场模式。
用例一
业务问题: 根据相似的特征、产品偏好和期望将客户分组/细分。细分是根据客户的人口统计特征、心理特征、过去行为和产品使用行为构建的。
商业利益: 一旦确定了细分市场,就可以为每个细分市场定制营销信息甚至产品。特定组织为目标选择的细分市场越好,它被认为在市场上越成功。
用例二
业务问题: 折扣分析和客户保留将帮助组织针对特定客户提供折扣,企业需要可视化“基于折扣行为的销售群体细分”和“客户流失以识别即将离开的客户细分” .
业务收益: 业务营销团队可以有效地专注于有风险的客户群,以避免失去这些客户。可以识别基于任何当前折扣策略面临挑战的销售团队细分,并且可以改进和优化交易谈判策略。
KMeans 聚类算法在识别组内模式和理解共同特征以支持有关定价、产品特性、某些组内风险等的决策方面非常有用。
相关帖子DA内容精选
- 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
|