行政任务#1:成为价值驱动,而不是数据驱动
当我听到高管们说他们想成为数据驱动型的人时,我就讨厌它,好像拥有数据本身就是有价值的。 现在,几乎没有人会指责这位无所作为的高管,他对数据的唯一观点与诸如“ 数据确实是新石油 ”(《华尔街日报》)或“ 世界上最有价值的资源不再是石油,而是数据 ”之类的陈述有关。(《经济学人》 )。 可以从Google趋势中确认对“数据驱动”与“价值驱动”的痴迷(图1)。
图 1: 数据驱动与价值驱动
但是,这就是数据和石油的价值确定存在分歧的地方。石油具有通用会计准则(GAAP)所确定的价值。 有关于如何在组织的财务报表中反映石油价值的会计准则。 石油的可量化价值是通过会计 “交换价值”原则确定的,石油商品市场可以确定“交换价值”。
但是(这是一个很大的方法),数据本身提供了零值,这是通用会计准则(GAAP)定义的。 没有市场可以确定一个人的数据的“交换”价值。 因此,数据不会出现在您的财务报表中。 使用会计“交换价值”方法,数据的价值为零。
另一方面,如果我们采用经济学方法(即“使用价值”方法),那么我们将拥有一个定义数据价值的框架,该价值(惊喜)由数据在何处以及如何用于创建新数据的方式来确定。可量化的客户,产品和运营价值的来源。 查阅“ 将经济概念应用于大数据 ”以了解旧金山大学与Mouwafac Sidaoui教授和我本人一起确定数据的经济价值的研究项目的更多详细信息。
因此,数据的价值并没有它(数据驱动),而在于您如何使用它来创建新的价值来源(价值驱动)。 为了利用数据的经济部分,高管需要从以数据为驱动力的思维方式(专注于积累数据)转变为以价值为驱动力的思维方式(专注于利用数据来获取和驱动客户,产品和运营价值的新来源) 。
数据可以是新油或在世界上最宝贵的资源,但它是埋在,这将决定在21的赢家和输家的
数据分析洞察圣世纪。
挖掘数据的经济价值
数据和石油之间最大的经济差异可能是,与石油不同,数据永不耗尽,数据永不磨损,并且可以在无限数量的用例中使用相同的精选数据集。 这构成了“ 施马佐的经济数字资产评估定理 ”和我争取诺贝尔经济学奖的竞选活动的基础(见图2)。
图 2:Schmarzo的经济数字资产评估定理
该定理产生三个经济“效应”,这对于数字资产(如数据和分析)而言是独特的:
效果1:边际成本趋于平缓。由于数据永远不会耗尽,永远不会磨损并且可以以接近零的边际成本进行重用,因此共享和重用“精选”数据的边际成本在许多用例中趋于平缓。
效果2:经济价值增长。共享和重用数据及分析可加快用例实现价值的时间并降低实施风险,从而推动经济价值的累积增长。
效果3:经济价值加速增长。经济价值之所以加速,是因为对一个分析模块的完善提高了使用同一分析模型的所有相关用例的经济价值。
数字资产的经济价值基于共享,重用和完善数字资产的能力;学习能力比竞争对手快,这挑战了有关组织如何创建差异化业务模型的传统思维。
因此,如果学习是明天的战场,那么让我们谈谈可以加速学习的两个关键AI开发。 这些关键的AI功能包括:主动学习(Active Learning),用于加速深度学习模型的生成;转移学习(Transfer Learning),用于更快地概括现有的
深度学习模型。
主动学习
主动学习是一种特殊类型的深度学习/机器学习算法,它利用人类主题专家(或其他信息源,例如Wikipedia)来优先标记模型输入数据。
机器学习模型基本上是猜测并检查机器-它们查看一些数据,计算出一个猜测,检查其答案,进行一点调整,然后使用一些新数据再次尝试[1](见图3)。
图 3:机器学习检查和猜测方法
有效的深度学习/机器学习模型的关键是访问标记的数据。 这通常需要人类主题专家(SME)的专业知识,其中该SME的专业知识取决于所标记数据的复杂性(在照片中容易标记猫和狗,在x-中难以标记癌症和肿瘤的类型)射线)。
主动学习使用数学技术来确定在分析模型的当前状态下SME需要标记哪些数据的优先级。 Active Learning并没有要求SME预先标记所有数据,而是对模型在那个时间点最容易混淆的数据进行优先级排序,并仅请求该数据的标签。然后,模型对新标记的数据进行一些训练,然后再次请求SME帮助标记新的“最令人困惑”的数据(即,图4中是“ 4”还是“ 9”?)。
图 4:将4与9区别开
通过优先处理最令人困惑的示例,该模型可以使专家集中精力提供最有用的信息。这有助于模型学习更快,并使专家可以跳过对模型不是很有帮助的标签数据(请参见图5)。
图 5:优先考虑需要中小型企业援助的问题
通过将SME的资源需求放在仅需要人工协助的问题上,这种人与模型的协作可以加速深度学习模型的开发和模型的准确性。
转移学习
在深度学习中,转移学习是一种技术,其中首先在一种类型的问题上训练神经网络,然后通过最少的训练将神经网络模型重新应用于另一种类似的问题(将
神经网络“学习”“转移”到另一个问题)。
转移学习是一种机器学习方法,旨在重用在解决一个问题并将该知识应用于另一个但相关的问题时获得的神经网络知识(权重和偏见)。例如,在尝试识别卡车时可以应用在学习识别汽车时获得的知识(参见图6)。
图 6: 来源:“ 关于迁移学习的全面动手指南 ”
转移学习是加快神经网络模型重用的关键。通过重新使用真实的,真实的,可正常工作的神经网络来加快实现价值的时间并降低未来项目的风险。
专注于价值驱动而非数据驱动的摘要
我最近在一次客户会议上发表声明:“一些分析师认为,在不久的将来,边缘存储的数据将超过云存储的数据。” 现在,我不知道该声明可能会变得如此真实,但是它是一个很好的挑衅性声明,有助于挑战高管当前的思维方式。 而这正是发生的事情。
当一位高管担心“我将如何管理所有这些新数据?” 时,我才立刻发表这一声明。 但是,当他想到“不,我们将如何利用所有这些新数据货币化 ”时,是我们的[即将成为]赞助商,他的眼睛闪闪发光。
如果学习是明天的战场,那么像主动学习和迁移学习这样的AI创新对于通过结合人类和AI的精髓来提高组织的学习能力至关重要。在知识型产业中,“学习经济”比“规模经济”更强大。 时至今日,每个行业都在成为基于知识的行业。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!