Hadoop是Apache的一个用java语言开源软件框架,利用集群对海量数据进行分布式计算,主要用于处理大规模数据。
商务智能(BI)发展到现在定位和市场也是一再变化,Gartner多次修改其定义,一般来说是以商业用户的业务需求为导向,利用数仓、数据挖掘、OLAP等技术和工具对数据进行加工清洗等处理,所得结果用于辅助企业经营和做决策,其目的是将数据转化为企业有用的信息。广义上的BI包括产品(软件、解决方案)也有指概念或方法等。
就数据分析而言,Hadoop框架利用MapReduce技术进行数据分析,重在处理大规模数据,更偏后台;BI软件中的数据分析多指在数据清洗加工后,对较规范的数据进行分析,以业务为导向更偏前端。尤其是敏捷型BI,因IT门槛的降低这一块大部分的工作完全可以交给业务人员来做,让业务方自己来探索数据。
现在有许多BI软件可以对接Hadoop,进行大数据的处理。