全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
2497 0
2016-08-10


店铺营销分析报告


训练营成员:韩要宾、董梦娟、宋姣、郭行桥

一 前言


        在电商数据运营中,对于客户而言,有两个很重要的指标对于扩大销售规模是很重要的:第一,提高顾客重复购买次数;第二,提高客户订单中的Basket size。而第二个指标提高Basket size,就是让客户从只购买一件产品转换到现在购买多件产品,从而提高整个购物篮的销售金额,最大限度地实现销售增长。

        本次报告,将对该服装店铺一年的销售数据进行关联分析,通过概念分层从不同粒度上分析商品之间的关联性,从而找到商品之间的关联规则,实现商品的推荐目的。


二 数据分析


1 数据预处理


一个购物篮中有可能多个商品且商品位于同一单元格中(如表一所示)。首先,将同一购物篮中的数据分离(如表二所示)。由于淘宝运营时,为了使得宝贝更容易被搜索到,宝贝标题一般比较多,但这对数据挖掘的影响比较大。因此,我们需要对关键词进行拆分、截取(如表四所示)。具体实现过程如下:

(1)、将"宝贝标题"列以中文逗号为分隔符进行分列

(2)、分列后的每个单元格中是一类商品的描述信息, 通过观察发现最后几位代表该类商品的代号, 利用字符串截取函数 将商品组后的代码截取出来

(3)、将截取到的商品代码去重复值,建立一张 代码-商品分类(例如:打底衫,衬衫,连衣裙,裤子)的对照表(如表三所示)

(4)、将分裂后的数据,按照建立的 代码-商品分类对照表,给出每个商品一个商品分类的结果

本次分析采用Apriori算法进行关联分析,在R语言中,必须将数据转化成两列(如表五所示)。采用VBA编程实现。代码如下所示;

1.png


表一 原始数据—宝贝标题

      2.png


表二 分离购物篮商品

3.png


表三 商品名称截取对照表

4.png


表四 商品名称截取

5.png


表五 数据拆分

6.png


2 关联分析


(1)高频词分析

在R语言中使用qseg类型分词,筛选100个词频最高的词,制作词云。 7.png


删除字符长度小于1的词,制作词云

8.png


代码实现如下:

9.png



2)关联规则分析—Apriori算法


关联分析前,我们需要对置信度、支持度、提升度进行深刻的理解。如果规则的提升度很高,但其相关的置信度很小,说明其市场规模很小。市场经营必须同时考虑市场规模大小以及精准程度大小的两个维度。如果规则的精准度精准,但其受众客户就只有几百个,对于销售额而言,一点影响也没有。而如果规则的提升度不是很高,但其受众客户涉及了几万人,对该部分客户进行营销,也能够有效的扩大规模,大幅度提高销售额。

关联规则挖掘任务分解为如下两个主要的子任务:

频繁项集产生:其目标是发现满足最小支持度阀值的所有项集,这些项集称作频繁项集.

规则的产生:其目标是从上一步发现的频繁项集中提取所有高置信度的规则,这些规则必须满足最小支持度和最小置信度。这些规则称作强规则。


Minimum support: 0.01 ,Minimum metric <confidence>: 0.3,结果如下:

                10.png

12.png

由于置信度度量忽略了规则后件中出现的项集的支持度,高置信度的规则有时可能出现误导。

解决这个问题的一种方法是使用提升度:lift(A,B)= P(B/A)P(B)或conf(A→B)/sup(B)

  如果提升度大于1,表明A和B是正相关的。如果小于1,表明A和B是负相关的。如果等于1,说明A和B相互独立。

当提升度大于1时,那么得到的规则能更好预测结果,而不是基于数据中的频繁程度猜测结果项是否会出现。

过滤掉提升度小于等于1的规则,并且通过sort函数,根据lift对rules排序。结果如下:

13.png


将关联结果,根据confidence进行排序,结果如下:

14.png

15.png

16.png

从关联结果可知,买T恤\连衣裙又买裤子关联性最强,其次是T恤\衬衫和裤子。在日常生活购物中,买了T恤、衬衫后再买裤子的概率极大,关联结果比较符合事实。


代码实现如下:

17.png


3 营销策略


(1)通过词云可以清晰的观察到,这家店主要销售对象多为女性,主要营销商品品类为裤子、连衣裙、毛衣、T、针织、衬衣、衬衫、外套、打底、短袖(词频前10)。通过此类信息,可以确定如下营销策略安排:在淘宝店铺的主页中最热产品,店长推荐栏等显著位置,摆置以上10个品类。


(2)推荐相应的促销礼包或优惠组合套装

18.png

从上述关联分析图中我们不难发现,裤子和 T是该店铺最畅销的产品,因此,我们采用畅销带动相关的营销策略

T+连衣裙、衬衫、背心、打底裤等促销。

裤子+ T+连衣裙、衬衫、背心、打底裤等促销。

裤子+卫衣、雪纺衫、鞋子等促销。


(3)进行相关产品推荐或者挑选相应的关联产品进行精准营销。

浏览商品T时,在购买过此商品的用户还购买过其他商品一栏中,添加裤子、连衣裙、背心。

浏览商品裤子类目时,添加T、卫衣、雪纺衫、鞋子。

浏览卫衣时,推荐裤子。

浏览雪纺衫时,推荐裤子。

浏览鞋子时,推荐裤子。

浏览背心时,推荐衬衫和T


4 其他

(1) 虽说我们进行的关联规则分析中,提升度以及置信度都比较高,但不意味着这样的捆绑销售就肯定可以取得很好的销售效果。因为,我们不知道该店铺在某月的时候,是否开展了类似于购买产品A即可赠送产品B的活动。


(2) 由于所给数据中我们无法获取商品的单价,如果该规则的客户本来购买了100元的商品,而关联规则中却出现了推荐其购买20元的同类型产品,这等于给客户进行了降档推荐,这样会使得销售额大幅减少,浪费销售机会。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群