全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1775 3
2021-07-07

SPSS国庆特训|统计与数据分析

课程内容附有全课程的完整案例、配套数据、案例背景以及理论理解的相关课件,有利于学习和进一步提高数据分析能力,因此学习本次课程的理由包括如下几项:

第一、 课程覆盖了统计学习和机器学习的核心技术,包括从小数据到大数据的实践应用场景,涵盖数据管理、数据可视化、表格自动化等内容,内容详实,实用性很强。

第二、 统计的核心技术习得过程遵循:理论原理介绍——案例背景解释——软件操作技术——统计实现——输出表格图形解释——应用建议。

第三、 以案例方式为学习主线,理论与数据分析经验融合,更具有场景代入感,使初学者更容易掌控和实现数据建模技术。

第四、 以数据分析流为宏观主线,附有对数据具体环节的介绍和理解,包括数据预分析和模型修正的常用技术。

第五、 系统详实的论文发表、论文写作技巧,结合和提高实证分析能力,完成统计建模,提升论文质量。


2021国庆SPSS统计与数据分析研讨班

培训时间:2021年10月1-5日

培训方式:现场班

培训地点:北京市西直门中坤大厦

培训费用:5000元/4200元(学生优惠价仅限全日制本科及硕士在读)

授课安排:9:00-12:00,14:00-17:00; 答疑

软件:SPSS、AMOS

课程对象: 面向高等院校、科研所的相应专业,如经济学、管理学、政治学、社会学、心理学、教育学等学科以及相关社科类从事定量学术研究的教师、博士硕士研究生和学者,另外使用SPSS进行商业数据分析的团队也是本次课程的受益人群。


目录总览:

第1天:

第一部分——综合案例

1.业务问题向统计问题的转化?

2.如何寻找影响因素?

3.数据描述探索

4.数据清理事项

5.模型特点及如何学习?

6.模型评估

7.综合解读模型输出

8.数据分析流程介绍

第2-4天:

第二部分——统计学习与机器学习

1.线性回归:文氏图

2.逻辑回归:主次归因

3.决策树:质量监控及规则归因

4.神经网络:质量监控及预测

5.主成分分析:特征选择技术

6.时序预测:销量预测

第5天:

第三部分——结构方程技术

1.结构方程原理

2.中介效应模型

3.多群组结构方程

4.自抽样与贝叶斯


报名流程:

1. 点击对应课程报名链接;

2. 经管之家论坛账号登录,在线提交报名信息;

3. 进入结算中心,订单支付;

4. 与JG学术培训樊老师确认发票信息;

5. 开课前一周发送课程资料,进入答疑群。

优惠信息:

经管之家现场班老学员九折优惠;

同一单位3人以上同时报名九折优惠;

同一单位6人以上同时报名八折优惠;

组合优惠与折扣优惠,学生优惠价均不叠加。


报名咨询:

樊老师

电话:18611083334

WeChat:fanyuliang_cda

论坛1.jpg


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-7-7 18:53:09

=============================================================

论坛.jpg

丁亚军

高级顾问任职于经管之家数据科学研究院高级研究员、电子工业出版社大数据专家委员会成员,学习路径图技术中心顾问、经管之家培训中心讲师。

研究方向“电商CRM数据挖掘”、“机器学习与深度学习算法”、“银行行为评分卡”。

============================================================

研究专项:

1.市场调查方向:态度类的问卷设计、技能测评类量表设计、问卷类调研及数据分析,统计基础理论(抽样、数理统计)、软件(spss、sas);

2.机器学习方向:电商数据挖掘(营销类数据分析、CRM客户行为分析类、客户画像等内容)、评分卡制作(银行类)、机器学习算法、软件(sas、python(sklearn))

3.深度学习方向:图像识别类的项目(图像分类任务、图像识别)、深度学习算法(卷积类与循环类神经网络)、软件(python(keras、tensorflow))

出版书籍:

l  《Python机器学习技术:模型关系管理》,电子工业出版社,作者丁亚军,2021年(本书将于2021年年底上市预售,暂未出版)。

l  《统计分析:从小数据到大数据》,电子工业出版社,作者丁亚军,2019年。

l  《如虎添翼:数据处理的SPSS和SAS EG实现》(第2版),电子工业出版社,作者(徐筱刚 常国珍 丁亚军),2015年。

大型项目:

1. 江苏广电CRM数据挖掘,数据分析架构搭建、数据分析与分析报告。

(1)数据库数据产品设计

(2)数据挖掘模型架构:布局、数据流、项目整合

(3)客户流失预警、VIP客户转化、客户画像

2.         中国城镇居民家庭投资调查:

(1)信息收集包括公共资源收集、访谈(资料编码)——根据项目方的需求使问题量化。

(2)市场调研:收集样本信息,随访、网络调查。

(3)数据分析:频率、相关性、回归、广义线性

(4)报告

3.         泸州老窖:泸州老窖目标管理与绩效考核:

(1)量化员工胜任能力、绩效

(2)建模:员工胜任能力与对绩效的影响。

4.         卫生部:中国卫生状况调查

(1)描述特征:基本人口学变量、烟龄与吸烟量、住房类型、饮水、距离、收入、人均年医疗支出、新农合、地区、职业类型、社保费用、商保费用、高血压指导。

(2)数据分析:健康指标预测监控。

(3)报告

5.人大经济论坛:论坛网页版块、颜色、偏好的优化

(1)对论坛用户进行调研(50名)

(2)获得不同属性偏好的数据文件

(3)对结果进行联合分析,以优化网页设置。

6.第三方咨询公司:***大型客户满意度调查分析

(1)收集和整理3000家门店的满意度数据

(2)开发数据挖掘和数据分析流程

(3)满意度模型算法开发

7.中国建设银行(郑州中心):银行申请评分卡咨询

(1)申请与行为评分卡治理

(2)布局数据挖掘算法——速度优化

(3)信用评分卡制作

8. 中国烟草(天津卷烟厂)

(1)第一阶段 数据价值与模型搭建

(2)第二阶段 方法论1:质量监控与问题诊断

(3)第三阶段 方法论2:风险预测

(4)第四阶段 方法论3:产品细分与异常诊断

企业内训:

1.中国工商银行(总部)数据挖掘培训与项目咨询。

2.中国移动(云南)移动分公司数据分析培训。

3.江苏广电(总部)市场调查全系列培训与数据分析。

4.中国银行(江苏)数据挖掘培训。

5.奔驰金融中心(总部)数据挖掘培训与项目咨询。

6.国家体育射击中心(总部)数据挖掘培训。

7.中国民航信息中心(总部)数据挖掘培训与项目咨询。

8.迈瑞医疗(总部)数据挖掘培训与项目训练。

9.字节跳动(西安)数据挖掘思维培训。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-7 18:53:41

时 程

数据分析项目

第一部分——综合案例


第1天


涵盖内容:

解决问题:了解数据分析每个环节的具体内容、技术要求,有助于在更宏观的层面上看待数据分析。

1. 数据分析流

(1) 业务问题向统计问题的转化?

(2)如何寻找影响因素?

(3)数据描述探索

(4)数据清理事项

(5)模型特点及如何学习?

(6)模型评估

(7)综合解读模型输出

(8)数据分析流程介绍



案例数据:使用工业质量数据“残耗”,讲解数据分析的全流程

第二部分——统计学习与机器学习


第2天

-

第4天


涵盖内容:

解决问题:线性回归是最基础的统计模型,也是应用较为频繁的统计技术,掌握这项技术有助于我们更好的学习其他所有模型。

1.线性回归:残差分析

     (1) 相关系数与回归

     (2) 线性回归:文氏图

     (3) R2+残差分析

     (4) 模型归因与预测

     (5) 回归模型的综合应用解释

解决问题:了解逻辑回归模型的原理及其在主次归因问题上的突出表现。

2.逻辑回归:主次归因

     (1) 卡方分析原理:期望与频数

     (2) 模型评估:正确率与ROC

     (3) OR效应与 RR效应的解释

     (4) 模型修正技术:工具变量

     (5) 异常值与稳健模型

解决问题:决策树区别于逻辑回归,强调通过可视化的方式回答规则归因问题。

3.决策树:质量监控及规则归因

     (1) 决策树概览及原理

     (2) 树桩、决策树与随机森林

     (3) 特征选择与运算

     (4) 决策树可视化

解决问题:神经网络擅长于将原始数据 “破碎化”,然后通过复杂的网络结构将其组合,形成一套识别数据的模式,进而可以利用其优势进行数据预测。

4.神经网络:质量监控及预测

     (1) 感知器模型=线性回归?

     (2) 感知器:运算规则

     (3) 多层感知器:结构层

     (4) 网络结构调整

     (5) 特征工程与神经网络

     (6) 神经网络与预测

解决问题:主成分通过数据压缩完成2个主要的工作:一个是特征筛选、一个是因子分析的结构效度分析。

5.主成分分析:特征选择技术

     (1) 主成分模型原理

     (2) 主成分的评估标准

     (3) 数据压缩与因子分析

     (4) 主成分回归模式

     (5) 探索与验证技术

解决问题:时间序列数据区别于横截面数据的显著特点是,行与行之间产生了相关性,这就需要特殊的时间序列模型ARIMA

6.时序预测:销量预测

     (1) 统计与时序可视化

     (2) 时间序列预处理:平稳性

     (3) ARIMA模型:p和q

     (4) 模型评估:r2与白噪声

     (5) 模型短期预测



案例数据:“绩效管理数据”、“机器故障数据”、“金融信贷数据”、“产品收益率数据”。

第三部分——结构方程技术


第5天


涵盖内容:

解决问题:结构方程模型的最基础原理是实现了方程的联立,这有利于解决多因变量问题以及复杂路径等问题。

1.结构方程原理

(1) 模型基本概念:潜变量、内生变量

(2) SEM模型原理:协方差

(3) SEM模型评价:5大指标

(4) 软件操作练习

解决问题:中介效应是结构方程模型中使用最为频繁的一种模型,有利于研究因果问题中的中介作用。

2.中介效应模型

(1) 中介效应与间接效应

(2) 中介效应的模型设定

(3) 效应值计算

(4) 多层中介存在的问题

解决问题:大型数据的显著其特点是数据内部聚集性,因此数据的组内和组间效应则成为模型效应分解的重点,多群组结构方程模型可以有效应对这些问题。

3.多群组结构方程

(1) 组内与组间效应

(2) 多群组结构方程模型

(3) 多群组模型设定及评估

(4) 群组间效度检验:效度分析

(5) 多群组均数检验

解决问题:与大数据不同的是,限于现实环境所限,收集的数据往往有限,出现了所谓的小数据,那么如何研究变量间的复杂路径或结构关系?自抽样和贝叶斯技术则应运而生。

4.自抽样与贝叶斯

(1) 大样本理论

(2) 自抽样与置信区间

(3) 贝叶斯与先验概率

(4) 小样本:综合技术总结



案例数据:“绩效管理数据”、“饮酒焦虑数据”、“满意度结构数据”


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-7-8 10:16:02
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群