全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 Hadoop论坛
2313 3
2016-01-27

大数据时代来了!数据浪潮奔涌而来,而大数据分析工具的作用就是让企业和个人在这数据浪潮中乘风破浪、获取数据价值。但是,现在市面上已经有不少的大数据分析产品,这些产品有何不同?到底该如何选择呢?我们就以“门外汉”的眼光来一探究竟!



实时数据分析和离线数据分析

实时数据分析一般用于金融、移动和互联网B2C等产品,往往要求在数秒内返回上亿行数据的分析,从而达到不影响用户体验的目的。特别是对于电商行业来说,实时的数据反馈是掌握“商机”的关键。



而离线数据分析对于大多数反馈时间要求不是那么严苛。离线分析更注重的是机器和系统性能与稳定,比如离线统计分析、机器学习、搜索引擎的反向索引计算、推荐引擎的计算等。这一类数据分析如果能有配套完整的数据库支持,在配合强悍的大数据分析工具,就能形成强大的数据管理、挖掘能力。



以上两种分析其实是客户的两种需求,在大数据分析工具的选用上,实时数据分析重在“实时”二字,强调数据的采集和传输,因此内存式的大数据分析工具就能胜任。而离线数据分析更加强调数据的价值挖掘,因此需要性能卓越的大数据处理工具,如国云数据的大数据魔镜,在数据处理方面能达到“秒”级的响应。



内存级别、BI级别、海量级别三种各有千秋

如果无法从业务层面界定需求,我们也可以从大数据分析工具本身的大数据处理能力上来考量其性能。首先是内存级别,这里的内存级别指的是数据量不超过集群的内存最大值,许多知名的大数据分析产品及时基于内存架构的。



BI级别和海量级别针对的数据对象都是真正的“大数据”,海量级别的大数据处理工具并没有什么指标,总之是能力越强越好。相对于内存级别和BI级别,海量级别的发展空间最大,同时也将拥有更多的功能和更强的兼容性。



大数据魔镜除了能对海量数据进行快速读取、分析外,还能将结果进行可视化展现,并且支持大屏展示技术,这也算是大数据分析工具的一个横向发展。虽然目前来看还是三种级别的数据分析产品并驾齐驱局面,但海量级别的大数据分析工具绝尘而去只是时间问题罢了。



我们在选用大数据分析工具时需要考虑的因素有很多,但是根本意愿还是要获取数据价值。工具是没有高低之分的,只有性能的强弱,而每一种工具都有其合适的用途和用处,因此,有时候不选最好,只选最合适才是正确的。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-2-3 15:51:20
大数据是未来的蓝海,工具自然很重要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-4 08:34:58
数据来源是核心,工具是跟着数据量与处理手段走的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-2-8 13:28:28
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群