2019/12/02
《增强型分析-AI驱动的
数据分析、业务决策与案例实践》读书笔记
《No.1: p1~p12》第1章 数据科学家的成长之路
1 何谓数据科学家: 能做数据分析并将数据价值发挥出来的人。
1.1 室外数据科学家: 算法使用者偏重工程,
数据挖掘者,这本书的数据科学家,主要讲的是 “室外数据科学家”
1.2 室内数据科学家: 算法开发者偏重科学,算法工程师
2 数据科学家是
人工智能时代最重要的部份
3 数据科学、人工智能、
机器学习等学科的关系,很难厘清,就不用太纠结了。
4 数据分析能力
4.1 描述性分析(事后诸葛)
4.2 诊断性分析(事后诸葛、有所洞见)
4.3 预测分析(有所洞见、洞烛先机)
4.4 (Prescriptive analytics)指示性分析 or 处方性分析 or 规范性分析(洞烛先机)
4.5 哈佛大學教授湯馬斯.戴文波特(Thomas H. Davenport)則再根據以上的基礎,再最後加入了「自動化分析(Automating Analytics)」,發展出五種分析方式(Five types of analytics of things)
5 数据科学家成长的阶段
5.1 算法: 如何构建模型
5.1.1 有监督学习、无监督学习
5.1.2 对算法有一个体系化的学习,才能灵活运用。
5.1.2.1 如何找到潜在有价值客户
5.1.2.1.1 响应预测模型
5.1.2.1.2 聚类分析
5.1.2.1.3 社交网络分析
5.1.3 需掌握参数调优的技能
5.1.3.1 Grid Search工具可帮助找出合适的超参数
5.2 用法: 如何回头看模型
5.2.1 模型验证
5.2.2 数据科学家需了解两种指标
5.2.2.1 模型性能指标(提升度、准确性、稳定性)
5.2.2.2 业务指标(评估收益或避免多少损失)
5.3 业务: 如何产生更大价值
5.3.1 数据科学家需深度融入业务,引领数据驱动的业务发展。
5.3.2 以客户旅程地图为例,说明不同的业务场景需要相应的模型
5.4 战略: 如何更广
5.4.1 企业应制定数字化转型战略
5.4.2 数据科学家应深度参予战略的制定等工作
6 数据科学的工作模式与组织架构
6.1 工作模式
6.1.1 数据驱动模式
6.1.1.1 较新业务领域采用
6.1.1.2 渐渐成为主要工作模式
6.1.1.3 业务专家也可以主导数据驱动模式
6.1.2 业务驱动模式
6.1.2.1 适合复杂业务
6.2 组织架构
6.2.1 分散式: 隶属业务部门
6.2.1.1 优点: 与业务紧密结合
6.2.1.2 缺点:
6.2.1.2.1 数据分析累积在个人,非团队上
6.2.1.2.2 没有上升空间
6.2.2 集中式: 独立专门的数据分析部门
6.2.2.1 优点: 团队稳定,有成长空间
6.2.2.2 缺点: 与业务脱节
6.2.3 混合模式:因地制宜
7 数据科学家的工作方法要点
7.1 准备工作
7.1.1 确认业务场景、数据可获得性、数据质量等
7.2 同时输出两种价值
7.2.1 重要发现
7.2.2 模型结果
7.3 充满想象力的工作
7.4 依照敏捷方式构建模型: 依照CRISP-DM方法论实施
7.5 以业务成果来衡量自己的工作