全部版块 我的主页
论坛 经济学人 二区 学术资源/课程/会议/讲座
73470 1117
2013-05-07
很多人咨询数据挖掘的课程,想学习不知道从哪里入门,只知道理论没有实践,没有经验丰富的老师指导,诸如此类的问题我们可以帮你解决。6月10日至12日人大经济论坛将举办由SPSS专家张文彤老师,IBM云飞老师主讲的SPSS数据挖掘与实战案例现场培训,使用最新教材最新软件,最经典真实的案例,带你学会数据挖掘的真正方法,案例概要如下。

SPSS数据挖掘与实战案例培训

培训时间:2014年6月10日-12日(3天)
培训地点:北京,海淀区  
培训费用:3500元。(包含发票,讲义,教材,工作餐)  全日制学生优惠价格2000元,不含发票。差旅及食宿费用自理。  
授课安排: (1) 授课方式:使用最新的SPSS  Statistics 21 中文版,中文多媒体互动式授课方式。
  (2) 授课时间:上9:00-12:00,下午13:30-16:30(16:30-17:00答疑)  
点击报名
报名优惠
1、老学员或三人以上报名九折优惠。
2、付费后赠送预习课程,价值千元SPSS视频课程
3、5月10日之前报名付费,额外赠送文彤老师最新教材《SPSS统计分析基础教程》或《SPSS高级教程》。
4、现在报名赠送论坛币2000个!


第一天 探讨消费者购买保健品的动机
  

学习前建议阅

  
数据分析方法体系简介,对统计方法体系做一基本了解;  

IBM SPSS Statistic操作入门,了解SPSS的基本操作方法。


案例导读



客户开发了一种针对女性的新保健产品,希望通过调研对该类保健品市场进行细分,然后根据公司的营销能力选择1-2个细分市场。整个研究计划采用三个步骤:市场细分/市场机会评估è目标人群确定è产品/品牌定位,来确定产品的市场定位,以确保产品的上市成功。

  

本案例涉及到的是第二阶段的研究,根据研究目的和问卷结构,确定采用因子分析来进行内在购买驱动因素的提取,最终确认了五项主要的驱动因素,并且就不同人群的驱动因素偏好进行了分析,为第三阶段的研究指明了大致的产品市场定位方向。



分析方法



t检验、相关分析、因子分析。



案例中用到的分析过程



表:设定表;

  

统计图:散点图;

  

比较均值:独立样本t检验;

  

相关:双变量;

  

降维:因子分析。



学习后建议阅读



第十二章  88年汉城奥运会男子十项全能成绩分析,继续深入学习因子分析。


偏态分布的激素水平影响因素分析
  

学习前建议

  

  IBM SPSS Statistic操作入门,了解SPSS的基本操作方法;

  

酸奶饮料新产品口味测试研究案例,了解方差分析模型的基本操作。



案例导读



在某个消化内科的科研项目中,研究者希望考察在控制了其他因素的作用之后,激素水平是否的确在对照组和实验组之间存在差异,以根据分析结果继续进行下一步的研究。

  

在统计描述中,研究者发现作为因变量的激素水平呈正偏态分布,因此在数据理解阶段用Bootstrap抽样方法和秩和检验方法进行了变量间关联情况的探索,随后分别采用变量变换、秩变换分析、Cox回归三种方法进行了数据处理,得到了所需的分析结果。



分析方法



Bootstrap抽样、秩和检验、秩变换方法、Cox回归。



案例中用到的分析过程



转换:计算变量、个案排秩;

  

表:设定表;

  

统计图:直方图、散点图;

  

比较均值:均值;

  

描述统计:描述、P-P图;

  

非参数检验:独立样本;

  

生存函数:Cox回归。



学习后建议阅读



第十章  INTAGE中国消费者信心指数影响因素分析,了解方差分析模型的衍生模型及应用。


脑外伤急救后迟发性颅脑损伤
影响因素分析案例
  

学习前建议阅读

  

某车企汽车年销量预测案例,了解线性回归模型的基本结构和结果阅读方式。



案例导读



研究者收集了脑外伤急救病例共201例,希望能够从中分析出导致急救后迟发性颅脑损伤的主要影响因素。

  

分析中首先利用标准的Logistic回归模型进行了影响因素筛选,然后利用分类树探索了子变量中是否可能存在交互作用,最后利用广义线性模型过程拟合了带交互项的Logistic回归模型。



分析方法



卡方检验、Logistic回归、树模型(分类树)、广义线性模型。



案例中用到的分析过程



转换:计算变量;

  

表:设定表;

  

统计图:堆积直方图、箱图;

  

描述统计:描述、交叉表;

  

回归:二元Logistic;

  

分类:树模型;

  

广义线性模型:广义线性模型。



学习后建议阅读



  INTAGE中国消费者信心指数影响因素分析,思考最优尺度回归方法在本案例中应用的可能性。


淘宝大卖家之营销数据分析
  

学习前


  数据分析方法论简介,了解三种数据分析方法论的异同;

  

数据分析方法体系简介,对统计方法体系做一基本了解。



案例导读



在本案例中,随着竞争的日益激烈,淘宝大卖家张三希望能够从头建立会员数据库,并利用这些数据改善其店铺经营状况。初期张三希望能够对会员促销的效果进行提升,并进一步深入分析存在重购行为的买家具有怎样的基本特征。

  

利用IBM SPSS Statistics的直销模块,分析师利用RFM模型进行了历史数据的分析,筛选出了应当优先考虑的促销名单;随后又进一步对存在重购行为的买家的基本特征进行了定位,该结果将被用于随后进一步改善营销活动的效果。



分析方法



RFM模型;

  

分类树(作为直销模块的后台方法被调用)。



案例中用到的分析过程



转换:计算变量、重新编码;

  

数据:选择个案、排序个案、标识重复个案、分类汇总、合并文件;

  

描述统计:交叉表;

  

直销:RFM分析、生成对产品作出响应的我的联系人的概要文件。



学习后建议阅读



第十六章  超市产品购买关联分析,体验数据挖掘方法体系在营销分析中的应用。


第二天    88年汉城奥运会男子十项全能成绩分析
  

学习前建议阅读

  

探讨消费者购买保健品的动机,了解因子分析的基本操作。



案例导读



本案例需要从88年汉城奥运会十项全能的真实竞赛成绩出发,分析出决定男性运动员十项全能总成绩的主要运动能力,以便有针对性的更快、更好的进行运动员的选拔和培养。

  

根据分析目的和数据特征,分析中先采用因子分析提取了公因子,随后利用公因子进行了回归建模(主成分回归),最后将回归模型还原至原始变量,从而对十项全能运动所考察的内在运动能力构成,以及外在的成绩驱动指标等都有了清晰的了解。



分析方法



相关分析、线性回归、因子分析、主成分回归。



案例中用到的分析过程



描述统计:描述;

  

相关:双变量;

  

回归:线性;

  

降维:因子分析。



学习后建议阅读



打败SARS,了解多维偏好分析、对应分析等基于因子分析衍生而来的信息浓缩方法。


  INTAGE中国消费者信心指数影响因素分析
  

学习前建议

  

酸奶饮料新产品口味测试研究案例,了解方差分析模型的基本操作;

  

  某车企汽车年销量预测案例,了解线性回归模型的基本结构和结果阅读方式。



案例导读



研究者希望对受访者的背景资料对消费者信心指数的影响状况加以研究,并进一步考察其内部的详细作用方式。

  

分析中首先采用方差分析模型进行了自变量筛选,然后建立多元方差分析模型进一步考察了其内部作用方式。在此基础上,又利用最优尺度回归深入探讨了自变量可能的各种复杂作用趋势,并利用多水平模型深入分析了信心指数变异在时间水平上的情况。



分析方法



方差分析模型、多元方差分析模型、最优尺度回归、多水平模型。



案例中用到的分析过程



统计图:直方图图组、线图、条图、散点图;

  

一般线性模型:单变量、多变量;

  

混合模型:线性;

  

回归:最佳尺度(CATREG)。



学习后建议阅读



无。


打败SARS
  

学习前建议阅读

  

  探讨消费者购买保健品的动机,了解因子分析的基本操作。



案例导读



本研究在2003年4月非典最为肆虐的时期进行,用CATI(计算机辅助电话访问系统)方式在北京、上海、广州访谈了各100位城市常住居民,希望对消费者生活现状受到的影响、目前消费者所关心的信息点、突发事件保险产品的潜在需求、非典之后消费者未来生活方式可能出现的变化等各方面进行了解。

  

根据分析目的和数据特征,本案例针对不同的研究目的分别采用多维偏好分析、多重对应分析、因子分析等方法进行了信息提取和结果的图形呈现。结果显示消费者关注的信息点和非典的流行阶段存在明显关联,突发险种的潜在购买群体应当是中高收入家庭,而非典对城市居民未来生活方式的影响也集中在更加注重家庭责任,更加注重健康这一总体趋势上。



分析方法



相关分析、因子分析、多维偏好分析、简单对应分析、多重对应分析。



案例中用到的分析过程



转换:计算变量;

  

表:设定表;

  

表:多响应集;

  

描述统计:交叉表;

  

相关:双变量;

  

降维:因子分析;

  

降维:最优尺度;

  

降维:对应分析。



学习后建议阅读



无。


住院费用影响因素挖掘
  

学习前建议

  

  INTAGE中国消费者信心指数影响因素分析,了解线性模型框架下各种衍生模型的基本知识,了解Logistic回归模型和树模型的优缺点比较;

  

探讨消费者购买保健品的动机,了解因子分析的基本操作。



案例导读



研究者希望通过对医院监测网络所采集到的病案数据进行分析,了解住院病人的费用结构分类、住院费用的主要影响因素,以确定是否可能建立全国范围的住院费用标准,并就中医、西医、中西医疗法的疗效、费用进行比较,从中寻找各类病种最佳的治疗方案。

  

根据分析目的和数据特征,本案例主要采用数据挖掘方法体系进行了分析,在利用聚类分析了解了费用结构分类之后,利用BP神经网络建立了住院费用、住院天数和疗效的预测模型,逐一回答了研究问题,最终结论为我国医疗体系的市场化运作不佳,同样类型的疾病在不同的医院间所需费用相差极大,因此制定全国统一的住院费用控制标准的时机尚不成熟。



分析方法



因子分析、层次聚类、BP神经网络。



案例中用到的分析过程



转换:计算变量、可视离散化;

  

数据:选择个案;

  

描述统计:频率、描述;

  

表:设定表;

  

降维:因子分析;

  

分类:系统聚类;

  

神经网络:多层感知器。



学习后建议阅读



  电信业客户流失分析,体验CRISP-DM方法论在真正的数据挖掘业务分析中的应用。


第三天   IBM SPSS Modeler操作入门
  

学习前建议阅读

  

数据分析方法论简介,对数据挖掘方法论做一基本了解;

  

数据分析方法体系简介,对统计方法体系做一基本了解。



案例导读



案例1:找出10个购买金额最大的客户。了解Modeler的数据整理功能;

  

案例2:发现客户购买产品组合的规律。了解Modeler的探索性数据分析功能;

  

案例3:直邮营销目标客户确定。了解数据挖掘模型的建立、检验和应用;

  

案例4:药物选择决策支持。了解CRISP-DM在解决具体业务问题过程中的应用、理解如何结合业务来评估数据挖掘的效果、了解数据挖掘结果的几种发布形式。



案例中用到的数据挖掘模型



决策树C5.0;

  

神经网络;

  

Logistic回归。



学习后建议阅读



第四部分各章节。


电信业客户流失分析
  

学习前


数据分析方法论简介,了解CRISP-DM数据挖掘方法论;

  

数据分析方法体系简介,了解各种常用的数据挖掘方法;

  

IBM SPSS Modeler操作入门,了解IBM SPSS Modeler的基本操作。



案例导读



本案例对电信业的流失问题遵循CRISP-DM方法论的流程使用数据挖掘方法,以三种思路建立了数据挖掘模型,对模型的效果进行了评估,并对模型的应用和如何进行营销预演进行了探讨。



案例中用到的数据挖掘方法



决策树模型;

  

神经网络模型;

  

目标变量为标志型离散变量的模型评估方法。



学习后建议阅读



  信用风险评分方法。


医疗保险业欺诈发现
  

学习前建议阅读

  

第一部分各章,以了解CRISP-DM数据挖掘方法论、数据分析方法及IBM SPSS Modeler的基本操作。



案例导读



本案例是一个医疗保险欺诈发现的案例。欺诈发现是数据分析的一个典型应用领域,但是欺诈发现的数据分析又有非常强的行业特征,读者在阅读本章时不必过于拘泥于所涉及的业务场景,可以重点关注使用数据挖掘方法解决欺诈发现的思路和方法。



案例中用到的数据挖掘方法



Benford定律;

  

聚类分析;

  

关联规则。



学习后建议阅读



建议学习完本章后重新回到第十八章:信用风险评分方法,对这两章做比较阅读,以体会建立欺诈模型在建模思路上和信用评分模型的区别。


信用风险评分方法
  

学习前建议阅读

  

数据分析方法论简介,了解CRISP-DM数据挖掘方法论;

  

数据分析方法体系简介,了解各种常用的数据挖掘方法;

  

IBM SPSS Modeler操作入门,了解IBM SPSS Modeler的基本操作;

  

电信业客户流失分析,从数据分析角度,第十七章与本章属于一个类型的问题,即离散变量预测问题,读者通过对两章的比较阅读可以体会两章使用方法和结果呈现方式的不同。



案例导读



本案例使用信用评分卡(Scorecards)的方法对银行贷款的风险水平进行评估,得到了易于被非统计专业背景的业务人员所理解的模型形式,同时还介绍了评分卡的建立步骤与注意事项。



案例中用到的数据挖掘方法



连续变量分箱方法;

  

Logistic回归;

  

评分卡方法。



学习后建议阅读



建议学习完本章后重新回到第十七章:电信业客户流失分析,对这两章做比较阅读;

  

  医疗保险业欺诈发现。


电子商务中的数据挖掘应用
  

学习前建议

  

  数据分析方法论简介,了解CRISP-DM数据挖掘方法论;

  

  数据分析方法体系简介,了解各种常用的数据挖掘方法;

  

  IBM SPSS Modeler操作入门,了解IBM SPSS Modeler的基本操作;

  

  电信业客户流失分析,了解目标变量为二分离散变量的预测模型与模型的评价方法。



案例导读



本案例是一个销售音像视频产品的电子商务网站的数据分析应用案例,在案例中使用了多种数据分析方法对网络日志、用户注册信息、用户登录、用户购买、产品信息等数据进行分析,建立了三个类别共七个数据分析模型,分别用于解决不同的用户行为分析需求。



案例中用到的数据挖掘方法



自动分类模型;

  

自动聚类模型;

  

决策树模型;

  

关联规则模型;

  

序列关联规则模型。



学习后建议阅读



无。



讲师介绍
张文彤  博士,INTAGE China全国技术总监,数据挖掘、市场研究、统计软件教学/应用领域专家。
钟云飞  资深数据分析专家,拥有超过10年的统计分析与数据挖掘在各行业的软件应用及咨询经验,历任SPSS、SAS软件公司首席咨询顾问,目前在国际商业机器(中国)有限公司软件部工作,从事SPSS软件企业应用的推广工作。



点击报名名额有限,报名从速!
咨询联系方式
曾老师
QQ号:619492407
电话: (010)68472925
邮箱: training@pinggu.org


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-7 13:52:08
学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 13:54:06
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 13:54:39
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 13:57:10
支持!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-7 13:57:12
好 支持
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群