为什么“公民数据科学家”的概念吓到我了
想象一下这种情况:
您进入牙医的办公室,作为对您上周进行的6个月检查的后续访问。您很紧张,因为检查发现牙龈出血,填充物破裂,这都是需要牙医修复的所有情况。
因此,您在大厅里紧张不安地等待着您的名字被叫来,设想各种牙科工具会很快被您折磨。最后,当您叫出名字时,您会被带到恐怖房间,并滑入椅子,这使您变得脆弱无助。探针,镐和定标器的图像在您的脑海中像自动收报机一样跟踪,直到陌生人的声音打破单调为止。
“你好,”他说。“我叫佩恩博士,我今天是你的公民牙医。”
公民牙医?您大声地重复他的问题,让他听到,想要对这个加油站声明的答案。“什么是公民牙医?”
得到这个。他回答说:“我是从事牙科工作的人,但是我的能力和专业知识不在牙科领域。”
图 1 :来源:鲁尼调子
我们所有您将永远不会拜访的公民牙医,公民心脏外科医师或公民结肠镜医师;您只需要咨询各自领域具有深厚专业知识的医生,他们会不断学习新技术并获得重新认证。
事实是,Gartner正在将这种确切的语言用于数据科学家。他们将“公民数据科学家”定义为创建或生成使用高级诊断分析或预测和说明功能的模型,但其主要工作职能不在统计和分析领域之外的人员。
等一下。
创建“数据科学公民”(Citizens of Data Science)是不是更有意义?该团体是一个由利益相关者组成的社区,他们了解如何识别,验证,估价和确定使用案例的优先级,在这些案例中,数据和分析可以派生和推动客户,产品和服务的新来源运营价值?
让我们仔细看看拥护数据科学公民的意义和重要性。
数据科学技能和专长
文章“ IBM在数据科学家中寻找什么”概述了一些关键的数据科学家技能,包括:
拥有MS或PhD的科学家培训
机器学习和统计方面的专业知识,侧重于决策优化
擅长R,Python或Scala
转换和管理大型数据集的能力
经验证的将上述技能应用于实际业务问题的能力
评估模型性能并进行相应调整的能力
虽然这份清单很有趣,但是如果我们期望我们的数据科学家能够提供有意义的,相关的客户,产品和运营价值,那是不够的。要实现价值,就需要一个拥有各种技能和观点的数据科学团队,他们需要了解如何发现价值的来源(见图2)。
图 2:数据科学是一项团队运动
数据科学团队由数据工程师,数据科学家和业务利益相关者组成。 就像棒球队无法仅仅依靠游击手和接球手有效地运作一样,数据科学团队必须清楚地阐明数据工程师,数据科学家和业务利益相关者的角色,职责和期望,如图3所示。[1]。
图 3:数据科学团队的角色,职责和工具
因为可能很难阅读图3,所以让我写出职责:
数据工程师的主要职责:
收集,管理,分析和可视化数据
管理数据基础架构和架构
开发用于建模,采矿和生产的数据集过程
提高数据可靠性,效率和质量
开发数据管道基础架构
开发横向扩展和纵向扩展解决方案
数据科学家的主要职责:
将业务问题转换为分析模型/算法
通过原始解释和建模为原始数据赋予价值
使用复杂的分析技术与数据进行交互
准备用于预测和说明性建模的数据
执行特征工程并识别数据中的隐藏模式
大规模自动使用说明性和预测性分析
通过故事吸引利益相关者
业务涉众的主要职责:
通过数据帮助企业做出更好的决策
使用数据满足业务查询
审查数据时部署批判性思维
查看数据时部署数学技能
进行商业智能活动
使用可理解的语言交流调查结果
数据管理和元数据管理
数据科学团队通过利用不同数据科学团队成员的观点和观点的差异来繁荣发展。拥抱推动AI创新的对立目标和分歧目标之间的冲突(有关未来博客中AI驱动创新的更多信息)。
熊与狼群:数据科学荚
因为聘请??一位能够做到这一切的数据科学家(这就是我所说的“熊”)是不现实的,所以我们在数据科学项目中部署了Wolfpack方法。我们利用Wolfpack的多个团队成员的经验,背景和意见的多样性来创建一个更强大,更全面的数据科学AI驱动的解决方案。
数据科学狼群方法以明确定义的角色,职责和期望体现在数据科学Pod中。这些数据科学Pod支持必要的“组织即兴性”,以应对数据科学活动的流动性和迭代性,数据科学Pod及其支持组织能够在数据热度期间改变角色,职责和期望科学之战(见图4)。
图 4:数据科学舱
由于对设计思维有偏见,我们正在创建一个即将发布的Data Science Pod Canvas(见图5)(使用它的人越多,画布就会越好)。
图 5:数据科学容器画布(测试版)
简介:创建“数据科学公民”
个人强者与集体强者……我们可以组建一名出色的数据科学家,但我对建立一种数据科学文化更感兴趣,该文化可以推动跨组织的协作(并利用冲突)来获取和驱动新的客户,产品和运营来源值。
而不是试图把主题专家到“市民数据科学家”让我们把它们变成“公民的数据科学”,并定义的角色,他们在帮助企业利用数据和分析来推动自己的业务模式,其中包括:
识别,验证,审核,评估和确定数据科学资源应重点关注的用例的优先级
确定将用来衡量进度和成功的指标和KPI
量化与误报和误报相关的成本
确保正确使用所得到的分析的治理(请考虑此处的道德规范,宝贝)
对产生的分析见解进行运营,以便一线员工和客户获得成功所需的见解
在确定分析在何处以及如何能够获得和推动新的客户,产品和运营价值来源方面获利
哦,顺便说一句,我有一整本书致力于创造“数据科学的公民”。如果您想教业务利益相关者“像数据科学家一样思考”,以使您的组织转变为利用数据经济学来发现客户,产品和运营价值的新来源,那么这本很好的,简单但高度相关的文章非常有用。
图 6:“像数据科学家一样思考的艺术 ”
在一个越来越多地由AI主导的世界中,成为数据科学的公民将成为每个人的责任-“ 像数据科学家一样思考 ” ,以便确定数据和分析可以优化关键业务和运营流程,减少安全和合规风险,发现新的收入机会,并建立更具吸引力的客户和合作伙伴参与度。
您只需单击一下,即可学习如何“像数据科学家一样思考!” Whatcha在等待什么呢?

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!