大数据中的数据源来自哪里?
本文介绍了关于大数据中的数据源来自哪里?数据来源说实话太多了。你可以通过自己的环境来确定这些来源是否合适。仔细思考每一个问题,就会发现大数据的每一条线索。
这些提供了解决业务问题所需的洞察。数据是结构化、半结构化和非结构化的数据。来源:
1、企业遗留系统— 这些系统是企业应用程序,执行业务需要的分析并获取需要的洞察:
客户关系管理系统
结算操作
大型机应用程序
企业资源规划
Web 应用程序开发
Web 应用程序和其他数据来源扩充了企业拥有的数据。这些应用程序可使用自定义的协议和机制来公开数据。
2、数据管理系统 (DMS)— 数据管理系统存储逻辑数据、流程、策略和各种其他类型的文档:
Microsoft® Excel® 电子表格
Microsoft Word 文档
这些文档可以转换为可用于分析的结构化数据。文档数据可公开为领域实体,或者数据改动和存储层可将它转换为领域实体。
3、数据存储— 数据存储包含企业数据仓库、操作数据库和事务数据库。此数据通常是结构化数据,可直接使用或轻松地转换来满足需求。这些数据不一定存储在分布式文件系统中,具体依赖于所处的上下文。
4、智慧设备— 智慧设备能够捕获、处理和传输使用最广泛的协议和格式的信息。这方面的示例包括智能电话、仪表和医疗设备。这些设备可用于执行各种类型的分析。绝大多数智慧设备都会执行实时分析,但从智慧设备传来的信息也可批量分析。
5、聚合的数据提供程序— 这些提供程序拥有或获取数据,并以复杂的格式和所需的频率通过特定的过滤器公开它。每天都会产生海量的数据,它们具有不同的格式,以不同的速度生成,而且通过各种数据提供程序、传感器和现有企业提供。
其他数据源—有许多数据来自自动化的来源:
地理信息:
地图
地区详细信息
位置详细信息
矿井详细信息
人类生成的内容:
社交媒体
电子邮件
博客
在线信息
传感器数据:
环境:天气、降雨量、湿度、光线
电气:电流、能源潜力等
导航装置
电离辐射、亚原子粒子等
靠近、存在等
位置、角度、位移、距离、速度、加速度
声音、声震动等
汽车、运输等
热量、热度、温度
光学、光、成像、见光度
化学
压力
流动、流体、速度
力、密度级别等
来自传感器供应商的其他数据