数据工程:收集、存储、处理数据,以便数据科学家查询。
数据流管理:采集原始设备数据的专门过程,同时管理成千上万生产者和消费者的流量。然后执行基本数据丰富、流分析、聚合、拆分、模式转换、格式转换等初级步骤,为进一步业务处理做数据准备。
数据治理:管理数据湖中数据的可获得性、可使用性、完整性和安全性的过程。
数据整合:组合不同来源数据并为用户提供统一视图的过程。
数据湖:一种以原始格式保存原始数据的存储库。
数据挖掘:通过检查和分析大型数据库来生成新信息的做法。
数据实现:将变量严格定义为可衡量因素的过程。
数据准备:收集、清理、整合数据到一个文件或数据表中,主要用于分析。
数据处理:机器检索、变换、分析或分类信息的过程。
数据科学:探索可重复的流程和方法,从而从数据中获取知识的领域。
数据沼泽:没有适当治理的数据湖就会变成数据沼泽。
数据验证:检查数据集以确保所有数据在处理之前是整洁、正确和有用的。
数据仓库:各种来源的大量数据,用于帮助公司做出明智的决策。
设备层:依据所处的环境和性能特征,来发送数据流的传感器、执行器、智能手机、网关和工业设备的整个范围。