随着商品经济的发展,零售业逐渐走向了成熟和理智,经营观念也发生了根本的改变。一旦一个人或一个团体成为企业的客户,就要竭力使这种客户关系趋于完善。在这种情况下,对顾客信息的跟踪、分析顾客的特征、对未来的经营趋势进行预测,就显得尤为重要。从大量的数据中挖掘出有用的知识,对隐藏的总体特征进行描述,对发展趋势进行预测,这正是KDD所要解决的任务。
首先要了解该领域的相关知识。如果领域知识没有考虑好,数据挖掘的剩余几个步骤将会产生无关的或扭曲的知识,对商业活动毫无价值或产生误导。在了解该领域的相关知识后,再设置数据挖掘的目标。每一个CRM应用都会有一个或多个商业目标,根据CRM的具体目标来设置数据挖掘的目标。企业定时或随时对上述的目标数据集进行知识发现操作,挖掘用户感兴趣的模式,即知识。在零售业CRM中设置要挖掘的目标是通过对交易数据库的分析,来发现哪些商品被顾客一起购买,利用该结果来制定相应的策略,从而提高商场的销售收入。在把交易数据转变成数据仓库中的数据之前,首先要进行数据清洗、数据组织和数据字典准备,使数据仓库中的数据满足分析的需求。最后利用相关的数据挖掘算法来挖掘出用户感兴趣的知识,从而采取一定的措施。
在我国的零售业
CRM中建立KDD系统,其处理过程可以分为以下4个步骤。
1)收集数据。需要收集的数据包括顾客信息、商品信息、以及顾客的消费情况。商品信息的收集比较容易实现。所需要的域的数量与知识发现任务的要求紧密相关,所要发现的模式越复杂、种类越多,则域的数量就要越多。最后,还要对这些顾客的消费情况进行跟踪记录。
2)数据的预处理。这一步骤可能包括对数据的完整性约束、一致性约束的检查、检查是否有错误数据并对其进行处理、对数据的表述方式进行转换等,最后得到目标数据集。
3)知识发现。企业定时或随时对上述的目标数据集进行知识发现操作,挖掘用户感兴趣的模式,即知识。
4)产生输出。输出结果的方式可以有很多种,这要根据用户的需要而定,它可以只是一个统计报表,也可以是对未来趋势的文字描述、图线图表。