第一题:
我用的是CRISP-DM模型
一、商业理解:对历史比赛的安排和结果,用数据挖掘的办法,设计赢得比赛的策略
二、数据理解:很简单,主要进行数据转化
地点:X-学院,D-大学
Sachin首发:Y-是
Girish进攻:Z-中锋,Q-前锋
Girish防御:Z-中锋,Q-前锋
对手中锋:S-矮,T-高
结果:W-赢,D-输
构建如下输入表:
地点,时间,Sachin首发,Girish进攻,Girish防御,对手中锋,结果
X,7pm,Y,Z,Q,T,W
X,7pm,Y,Q,Z,S,W
D,7pm,Y,Q,Q,T,W
D,9pm,Y,Q,Q,S,D
X,7pm,Y,Z,Z,T,W
D,7pm,Y,Z,Z,S,W
D,9pm,Y,Z,Q,S,D
X,7pm,Y,Z,Z,S,W
X,7pm,Y,Z,Q,S,W
X,7pm,Y,Z,Q,T,W
三、建模
用贝叶斯模型,结果如下:
策略:
1、前提:保持Sachin首发
2、约比赛时间为7PM,赢
3、约比赛地点为主场,赢
4、如果2、3均为否,设法引诱对手上高大中锋,赢
5、如果2、3、4均为否,Girish防御中锋,赢
四、模型评估:在其后的比赛中评估
第二题:没有数据,只能写出思路
我用的是CRISP-DM模型
一、商业理解:对电视转播重要比赛前后的快餐销售进行数据挖掘,以建立预测模型,提前准备生产能力和服务能力,并可以有针对性地对该客户群体开展销售推动,或设计对该客户群体更有针对性的产品,等等。
二、数据理解:
1、收集数据,要求收集一段时期每日分时段的快餐销售数据(最大以小时计算)
2、收集数据,要求收集对应时期内电视转播重要比赛的起止时间
3、数据转换,以电视转播比赛开始时间为0,将快餐销售的时间数据标准化,
4、做图,以销售量为纵轴,以标准化后的销售时间为横轴,通过直观的方法,圈定模型的类型
三、建模:
多元回归,以销售量为因变量,以标准化时间(影响冲击销售量)、实际时间(影响自然销售量)、地点或天气、节假日等其它因素(可能选择的变量)为自变量,建立回归模型。
四、模型评估:在其后的销售中评估