数据必须符合目的并受到决策社区的信任,因此可以做出和执行自信的决策。
从数据开始
数据是任何分析、报告和决策功能的基础要素,在危机期间尤其如此。我们都熟悉显示当前大流行状态的各种数据仪表板。为这些仪表板提供数据的数据源来自全球各地的报告机构。这些报告被用来做出影响生活在其国家的公民和在其中经营的企业的日常生活的判断。
审查任何数据报告的数据专业人员需要质疑提供给仪表板的数据的准确性和可靠性:数据经过了哪些类型的审查,以确保数据准确、一致、完整且没有重复?我们是否拥有所有数据,还是仅获得部分信息?采取了哪些类型的数据治理实践来确保报告的结果可用于决策?正在使用的数据类型的透明度是多少?
数据策略是确保所使用的数据能够产生准确的分析和报告的最佳机制,从而可以做出正确的决策。数据战略的目标是确保数据资源的定位能够轻松高效地使用、共享和移动,同时确保用于分析和决策的数据准确、透明和可靠。以下基本数据策略组件可以帮助建立对仪表板的信任,无论是否发生危机。
数据识别
无论结构、来源或位置如何,都必须识别数据并理解其含义。建立一致的数据元素命名和值约定是使用和共享数据的核心。这些细节应该独立于数据的存储方式(例如,数据库或文件)或它所在的物理系统。该组件将帮助识别丢失的数据。
查看一些可用的仪表板会发现一些缺失的元素,以便完整准确地描述该病毒。是的,仪表板按国家、省、州等显示活跃病例数、存活率和死亡率等类别,但通常缺乏每个类别中的统计信息。例如,我们能否确定为什么一个人死于病毒,而另一个人却没有?或者,社交距离、家庭或州的封锁是否有效?
数据专业人员应考虑需要哪些其他数据来回答其他问题。例如,我们是否应该将正在报告的数据与死亡和/或康复患者的历史不可识别的健康数据(例如年龄、性别、国家和城市)相结合,以确定哪些共同因素) 是为了死亡率还是生存率?我们是否应该叠加其他数据,例如污染水平数据、与医疗设施的距离、医疗保健类型、手机位置数据、人口统计要素和其他第三方数据,以了解这些因素是否起作用?
通过能够识别到位的数据并协调缺失的数据,我们正在了解支持最佳决策所需的内容,并能够回答更深入、更完整的问题。
存储和供应
下一步是确保所需的数据随时可用于分析和决策。数据将与许多其他系统共享,因此以简化访问的方式有效解决存储问题至关重要。存储数据的目的是确保数据可用并以允许可共享性并减少复制数据的需要的方式提供。在当前大流行的情况下,为了对其他组织有用,数据需要以一种可供更大社区访问的方式存储,并且可以广泛共享和使用。
流程和治理
需要准确管理数据,以确保分析过程的透明度和信任度。这证实了数据已经过审查和适当调整,以满足数据用户/社区的需求,并且符合治理政策。治理在整体数据战略中发挥的作用是确保数据得到一致的管理,并提供决策所需的透明度和信任。治理确保一旦数据与创建它的应用程序分离,所有数据组成部分都知道并尊重数据的规则和细节。
对于此类仪表板,一些流程和治理注意事项如下: 是否有概述各种报告元素或含义的文档?如果数据是外推的,它是如何完成的?我们使用的是整个数据集还是样本?数据是否正在处理、增强或标准化,如果是,如何处理?
总而言之,数据策略可确保为分析和决策需求正确识别、存储、配置、处理和管理数据。借助正确的数据,在正确的地点、正确的时间,可以做出更准确、更及时的判断,以确保成功解决业务问题,或者在当今的当前环境下,应对和应对大流行的蔓延。
相关帖子DA内容精选
- 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
|