全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
3244 8
2016-03-18

数据分析师给你支招:大数据创业的五大投资热门领域


万物皆数据的时刻到来时,商业发展的更多新机会将会出现,数据将会帮助我们更好地做出判断,比如,什么时候最适合吃饭、什么时候身体疲惫适合睡觉和什么时候记忆力最好等,这些都能通过数据来进行预判。甚至于,当记录了人的足够数据之后,数据就可能告诉我们此时此刻应该做些什么及最佳的策略。也许在那时,决定人是否聪明的指标,已经不是 IQ,而是是否拥有足够优质的数据。


(46).jpg


从谷歌的GFS和Bigtable的两篇论文发表到如今大数据市场的繁荣,又经历了近十年的时间!大数据的快速展得益于互联网的发展,也得益于Apache基金会开源力量的努力,自2005年Hadoop成为Apache项目,Yahoo、Facebook等互联网公司为大数据的发展作出了巨大贡献,也培养了一批大数据技术研发和应用的骨干人才。


随着大数据技术的初步成熟,在资本推波助澜下,大数据创业投资异常火爆,孕育出一大批大数据创业企业。五个热门投资领域包括:


(120).jpg


1、Hadoop 商业化


Hadoop商业化的三家马车分别是Cloudera、Hortonworks和MapR。Cloudera是Apache Hadoop著名的项目发起者Doug Cutting创办的企业,根正苗红,得到了IBM、Oralce等企业的支持,在行业应用方面的市场份额也最大。Hotonwork则是源于Yahoo 的团队,在2011 年从雅虎拆分出来,完全致力于推进Hadoop开源平台,Hortonworks与微软建立了很好的合作关系。MapR选择了Apache的很多组件,但放弃了HDFS,属于独树一帜,它与EMC具有战略合作关系,ComScore是它的客户。


(86).jpg


2、SQL on Hadoop


为了提升Hadoop的分析能力,在Hive的基础上,SQL ON Hadoop技术不断发展,Cloudera的impala、Hortonworks的stinger和Facebook的Presto进一步发展。这一技术领域也带动了创业公司的发展,如Hadapt,它提供了对关系型数据库和非结构化数据的交互访问;WibiData,它提供了对Hadoop的封装,连接前端应用到Hadoop基础设施。


(106).jpg


3、NoSQL数据库


NOSQL数据库是大数据技术创业公司最为活跃的领域之一。Datastax出售商业化的Cassandra,Cassandra是由 Facebook贡献的Apache开源列存储数据库。Mongodb是个基于分布式文件存储的数据库,被互联网企业广泛应用。Sqrrl则是由 Apache 开源的Accumulo发展起来。目前,这些NOSQL数据库厂商都受到了资本的青睐。


(73).jpg


4、大数据分析与可视化服务


大数据分析属于应用领域,因为更贴近市场需求,见效更快,受到资本的欢迎,一大批创业公司涌现出来。tableau、KarmaSphere、 Datameer、metamarkets等公司是其中佼佼者,他们的大数据分析工具已经能够整合Hadoop、NOSQL数据库,并在此基础上实现分类、聚类、推荐等算法,动态分析和展现数据分析结果。


(51).jpg


5、行业大数据应用


为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析,帮助这些行业提升数据分析的水平,如DataSift、RelateIQ、RocketFuel等创业公司。



随着大数据技术的进一步发展,Hadoop 2.0、流计算、内存计算、移动数据分析、大数据存储、大数据云等创业企业也逐步壮大起来,大数据创业投资的市场仍将欣欣向荣。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-18 11:16:12
物皆数据的时刻到来时,商业发展的更多新机会将会出现,数据将会帮助我们更好地做出判断,比如,什么时候最适合吃饭、什么时候身体疲惫适合睡觉和什么时候记忆力最好等,这些都能通过数据来进行预判。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-18 11:17:38
随着大数据技术的初步成熟,在资本推波助澜下,大数据创业投资异常火爆,孕育出一大批大数据创业企业
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-18 11:18:35
我耐心等待,就是想看看大数据能火多久……咱们中国,从上到下各个领域都在赶时髦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-18 11:18:41
Mongodb是个基于分布式文件存储的数据库,被互联网企业广泛应用。Sqrrl则是由 Apache 开源的Accumulo发展起来。目前,这些NOSQL数据库厂商都受到了资本的青睐。
大数据寻求的是海量数据,海量到什么份上?就是全样本。全样本和抽样显然是不同的。过去的研究,由于操作性的关系,很难做到全样本,需要去抽样。抽样的科学做法是“随机”——不过这一点听着容易,做起来相当困难。真正的随机抽样需要花很多钱(利用社交网络关系,通过一个用户做问卷再发动这个用户找更多的人来做问卷,一点都不随机),而且一个无法绕过的弊端在于:如果你使用调查问卷的方法,你很难排除回答者的语言回答一定就是ta心中真正的想法或者实际上的真正行为。


"大数据分析的三个思维方式:
1、不要依靠分析少量的数据样本,不要抽样调查。要分析与某事物相关的所有数据。
2、不要追求精确性,要乐于接受纷繁复杂的数据。
3、不要探求难以捉摸的因果关系,转而关注事物的相关关系。"


"大多数的互联网行业特别是电商行业对于数据分析师这块还是比较看重,主要的原因其主要的资产除了产品、人员就是长期积累的数据而这些海量的数据已经不能用人工经验来还原业务,这就需要数据分析师对于数据进行归纳与还原商业规则与逻辑,一般主要涉及商业分析、用户分析、产品分析、运唯支撑等这几块;说白了就是换个行业都可以在职场上存活下来;一般需要以下几个要求:
1、数据分析经验;
2、商业数据敏感度;
3、基本工具(SAS、SPSS、SQL、EXECEL等);
4、建模;
5、知识点(统计学、会编程);"


软件只是帮助我们完成任务的工具。并不是我们只要学好的软件操作就能很好地完成任务,因为与操作相比,如何解释最后的结果要重要的多。即使软件操作的再熟,如果看不懂结果,那跟不会才做没有两样。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-18 11:19:39
随着大数据技术的进一步发展,Hadoop 2.0、流计算、内存计算、移动数据分析、大数据存储、大数据云等创业企业也逐步壮大起来,大数据创业投资的市场仍将欣欣向荣。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群