全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1180 0
2020-11-16
什么是DataOps以及为何对数据货币化价值链至关重要
图 1:开发和运营数据科学
图1突出显示了分析模型开发和运营的两个关键阶段:
Analytic Model Development利用设计思想的协调性来帮助识别(头脑风暴)并最终将数据中埋藏的模式,趋势,关联和关系编成代码,从而更好地预测性能。
分析模型的运营需要数据科学与DevOps之间的紧密合作,以将分析模型集成或嵌入到运营和管理系统中,并建立常规的测量和反馈过程,以便不断地调整和提高分析模型的性能。
数据科学,设计思维和DevOps是分析模型开发和运营中的关键组成部分,但我们仍然缺少“数据货币化价值链”的关键部分– DataOps。
但是,与我的博客一样,我们首先需要从类比入手,以帮助我们理解“数据货币化价值链”。 让我们回到我们友好的邻里经济隐喻……石油。
石油经济学≈数据经济学
我的博客“数据策划:将原始数据编织成商业黄金”讨论了石油经济学与数据经济学之间的相似之处;这些数据将推动21个经济增长日 世纪在大致相同的方式,石油燃料的20个经济增长个 世纪。该博客提到了一个事实,即真正的经济价值不在于原油,而实际上在于“精选”燃料。原油经过提炼,调合和工程处理,其中原油被转化为更有价值的产品,例如石油石脑油,汽油,柴油,沥青基,取暖油,煤油,液化石油气,喷气燃料和燃料油。  这是一个至关重要的过程,需要最终用户(例如您我和我以及工业界的关注者)才能真正从石油中获得价值(参见图2)。
图 2:数据就是新油
有一个完整的“石油货币化价值链”(参见图3),其中包括以下领域[1]:
的上游 扇区涉及用于探索和石油原油和天然气的开采。上游石油部门也被称为勘探与生产(E&P)部门。上游部门包括寻找潜在的地下或水下油气田,钻探性勘探井,以及随后运行的井,以将石油原油和/或原始天然气回收并带到地表。
的中游 扇区涉及储存,销售和运输石油原油,天然气,液化天然气(主要是乙烷,丙烷和丁烷)和副产物硫。中游运营有时包括在下游类别中。
的下游 部门涉及石油原油的精炼和原料天然气的处理。它包括加工天然气的销售和分销以及从石油原油衍生的产品,例如液化石油气(LPG),汽油(或汽油),喷气燃料,柴油,其他燃料油,石油沥青和石油焦。
图 3: 石油货币化价值链
嗯,将原始数据转换为客户,产品和运营见解以帮助组织推动其业务和运营模型的故事非常相似。 只是我们缺少“数据货币化价值链”的关键组成部分-DataOps。
DataOps的作用
那么,什么是DataOps?
DataOps是数据收集,组装,管理,策划和发布的正式学科,包括:
数据验证包括清洁度,完整性,对齐方式,准确性,粒度,及时性和延迟。
元数据扩展包括描述性元数据,结构性元数据,管理元数据,参考元数据和统计元数据。
用于确保跨用例的可用性,可用性,完整性,安全性和使用合规性的治理。
数据分类和索引编制,以便可以轻松地搜索,发现,访问,理解和重用数据。
DataOps是提高数据科学团队生产力和效率的关键。它使您的数据科学团队能够探索变量和度量标准,这些变量和度量标准可以更好地预测性能,而不会在数据聚合,清理,集成,对齐,准备,管理和发布过程中加重负担(请参见图4)。
图 4:什么是DataOps?
DataOps是组织的数据货币化价值链中缺少的部分。 DataOps构成了基础,可帮助组织更有效地利用数据和分析来支持其业务和运营模型(参见图5)。
图 5:数据货币化价值链
2019年将是数据工程师的一年, 因此2019年也将是DataOps的一年。 就像将石油转换成比原始资产贵15到25倍的资产一样,数据工程师将采用DataOps来推动组织数据价值的增长。但是有一个小例外:
当数据永不耗尽,永不磨损且可以在几乎零的边际成本下在无限数量的用例中使用相同的经过整理的数据集时,数据比石油有价值多少?
好吧,那将是用于分隔崇拜者在21个获奖者键方程式ST 世纪经济战。
最后,获胜的组织将是那些能够更有效地利用数据和分析的独特经济特征来为其业务和运营模型提供动力的组织(请参见图6)。
图 6: 大数据业务模型成熟度指数
您的组织在利用数据和分析来支持业务模型方面的效率如何?
要问的问题很简单。很难回答。但是,如果你不能回答这个问题,你得在数据和分析注入21没有成功的机会ST 世纪经济战!
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群