数据科学之python
“我们需要更多的数据科学家”
不,您不需要更多的数据科学家。您需要建立整个数据科学社区,其中包括数据科学家,数据工程师和业务利益相关者(见图2)。
图 2: 建立数据科学社区
数据科学是一项团队运动,要确保所有数据科学参与者都追求相同的目标,并使用相同的关键绩效指标和指标来衡量进度和成功,这是业务成功的关键。建立数据科学社区的关键活动之一就是将业务用户转变为“数据科学的学生”。 我们使用“像数据科学家一样思考”方法作为该培训的基础(参见图3)。
图 3:培训业务利益相关者“像数据科学家一样思考”
在Lorcan Malone的领导下,爱尔兰Analytics(分析)研究所正在与Edison数据科学框架一起定义一组材料,这些材料分解了将数据科学定义为专业实践所需的技能和能力的复杂性。 请访问Google Analytics(分析)行业认证网站,以了解有关他们提供的数据科学认证计划的更多信息。
仅拥有更多的数据科学家是不够的。 我们需要组织的所有部门“像数据科学家一样思考”。
Snake#2: “只需抓取数据并开始使用它”
抓住Tableau之类的工具并开始使用数据很有趣,但是如果他们不确定自己在寻找什么,很难知道是否找到了有意义的东西。
正如Yogi Berra所说的那样:“如果您不知道要去的地方,那么您将到达其他地方。”
为了确保我们的数据科学项目正在就组织最重要的业务计划寻找战略,可行和有意义的见解,我们创建了假设发展画布(见图4)。
图 4:假设开发画布0.4版
我们开发了假设发展画布,以确保您彻底了解要完成的任务,相关的业务和运营价值,如何衡量进度和成功以及与假设相关的障碍和潜在风险。假设发展画布旨在促进业务涉众与数据科学的协作。
Snake#3: “一切都与
机器学习和AI等技术有关”
经济学的力量比机器学习和
人工智能更强大。 经济学是与财富的生产,消费和转移有关的知识的分支。 特别是,经济学是关于确定客户来源和市场价值创造的。 正如我在采访中讨论的“大数据现在是经济学,而不仅仅是技术”:
“……我们倾向于将大数据和数据科学以及机器学习和人工智能视为一种技术对话。我将在这里完全更改框架。这是一场经济对话。这不是技术对话。技术至关重要,对不对?我们需要了解,那里有27种不同类型的
神经网络功能。但是最后,这是一场经济对话。 从组织的角度来看,我正在做什么以识别和捕捉这些价值和创造财富的来源? 那是经济学。”
Snake#4: “大数据与数据量有关”
使大数据变得有价值的不是数据量;而是 这是粒度。 它可以根据个人(行为模型)或事物(数字双胞胎)构建详细的分析配置文件。 Analytics Profiles提供了一种资产模型,用于以一种促进在多个业务用例中优化和共享那些分析资产的方式来捕获组织的分析资产。分析配置文件由度量标准,预测性指标,细分,得分和业务规则组成,这些规则对组织的关键业务实体(例如客户,患者,学生,运动员)的行为,偏好,倾向,倾向,倾向,兴趣,关联和从属关系进行了整理,汽车,机车,CAT扫描仪和涡轮机(请参见图5)。
图 5: 风力涡轮机的数字孪生示例
分析配置文件是重要的数据科学概念,因为组织围绕这些分析配置文件将推动其数据货币化工作。有关分析配置文件和数字孪生的更多详细信息,请参见以下博客:
分析配置文件:数据货币化的关键
分析配置文件的最佳做法
数字双胞胎时代的同类群组分析
蛇5: “数据科学计划必须由首席信息官领导”
最成功的数据科学计划不是由CIO领导,而是由企业领导。 从数据科学计划中获得最大成功并获得最大成功的组织是那些业务领导者确定业务,运营和财务目标,并与数据科学团队合作以构建支持这些目标的分析的组织。 数据科学最终涉及的是业务模型,以及组织在利用数据和分析来支持其业务模型方面的有效性(参见图6)。
图 6: 大数据业务模型成熟度指数
顺便说一句,当会议上比较分析业务模型时,ICON业务分析主席兼UCD自然计算研究与应用组主管Michael O'Neill教授将我与Thomas Davenport列入同一图表时,我感到非常荣幸。 7)。 那是稀有的气氛!
图 7:比较Schmarzo和Davenport Analytics成熟度模型
Snake#6: “数据货币化是关于出售数据”
太多的公司认为数据货币化与销售数据有关。考虑到典型公司资产的资产负债表方面,他们采取“交换价值”或会计的观点是自然的反应。
但是,数据货币化是一种“使用价值”游戏,其中数据的价值取决于您可以从数据中获得多少价值来支持组织最有价值或最重要的业务和运营用例(例如,减少客户流失,减少过多和过时的库存,提高按时交货率,减少计划外的患者再次入院,提高5年大学毕业率)。 数据货币化是利用数据创造财富或价值新来源的经济学方法。
1