全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 Hadoop论坛
4418 0
2017-03-11

大数据中的数据源来自哪里?

本文介绍了关于大数据中的数据源来自哪里?数据来源说实话太多了。你可以通过自己的环境来确定这些来源是否合适。仔细思考每一个问题,就会发现大数据的每一条线索。

这些提供了解决业务问题所需的洞察。数据是结构化、半结构化和非结构化的数据。来源:

1、企业遗留系统— 这些系统是企业应用程序,执行业务需要的分析并获取需要的洞察:

客户关系管理系统

结算操作

大型机应用程序

企业资源规划

Web 应用程序开发

Web 应用程序和其他数据来源扩充了企业拥有的数据。这些应用程序可使用自定义的协议和机制来公开数据。

2、数据管理系统 (DMS)— 数据管理系统存储逻辑数据、流程、策略和各种其他类型的文档:

Microsoft® Excel® 电子表格

Microsoft Word 文档

这些文档可以转换为可用于分析的结构化数据。文档数据可公开为领域实体,或者数据改动和存储层可将它转换为领域实体。

3、数据存储— 数据存储包含企业数据仓库、操作数据库和事务数据库。此数据通常是结构化数据,可直接使用或轻松地转换来满足需求。这些数据不一定存储在分布式文件系统中,具体依赖于所处的上下文。

4、智慧设备— 智慧设备能够捕获、处理和传输使用最广泛的协议和格式的信息。这方面的示例包括智能电话、仪表和医疗设备。这些设备可用于执行各种类型的分析。绝大多数智慧设备都会执行实时分析,但从智慧设备传来的信息也可批量分析。

5、聚合的数据提供程序— 这些提供程序拥有或获取数据,并以复杂的格式和所需的频率通过特定的过滤器公开它。每天都会产生海量的数据,它们具有不同的格式,以不同的速度生成,而且通过各种数据提供程序、传感器和现有企业提供。

其他数据源—有许多数据来自自动化的来源:

地理信息:

地图

地区详细信息

位置详细信息

矿井详细信息

人类生成的内容:

社交媒体

电子邮件

博客

在线信息

传感器数据:

环境:天气、降雨量、湿度、光线

电气:电流、能源潜力等

导航装置

电离辐射、亚原子粒子等

靠近、存在等

位置、角度、位移、距离、速度、加速度

声音、声震动等

汽车、运输等

热量、热度、温度

光学、光、成像、见光度

化学

压力

流动、流体、速度

力、密度级别等

来自传感器供应商的其他数据


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群