全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1874 2
2015-08-29

大数据分析正处于青春期:茁壮成长但并未达到成熟


近几年大数据分析在国内蓬勃发展,成为一个新兴的职场热门领域。对于大数据分析的发展,很多人觉得现在国内的大数据分析行业已经发展得很不错了。但我觉得,大数据分析正处于青春期:茁壮成长但并未达到成熟。为什么这么说呢?下面就看看小编的讲解。


现在的大数据(公司)就像一个懵懵懂懂的青春期少年,充满活力和想象力,但却远未达到成熟。它的潜在价值让人着迷,但世人依然不知何处才是他将一展身手的舞台。


维克托•迈尔•舍恩伯格的《大数据时代》被国人奉为经典,其观点被反复引用,出现在各类文章之中,但也引起了不小的争议。但本文不是对《大数据时代》的批判,而是从数据分析发展的维度去探讨大数据的朦胧面目。


大数据的兴起不过是最近几年的事情,大量的案例都与互联网科技公司相关,其代表性的软件和算法都与谷歌和雅虎公司的科技人员密不可分。对于这些科技人员来说,“数据”几乎与”大数据“同义,而他们的主要工作就是通过根据这些海量的数据进行“推荐”——即将A匹配给B,如把合适网页匹配给关键词,把特定广告匹配给特定用户等等。而要做好匹配,则必须对于数据间的相关性进行研究…… 看过《大数据时代》的同志们,看到这里有没有获得一些启发呢?


为什么除了互联网公司外,其他公司都对“大数据”兴趣寥寥呢?这是因为现实中,许多数重要的数据集都是小数据,比如财务数据,销售数据等等,而拥有大量数据的金融和医药行业本就没有停止过数据应用。商业环境的改变远非一朝一夕,如何将大数据应用到传统行业中远比买一堆设备来存储个全数据要难得多。


另一方面,大数据并不一定更好,滥用大数据只会产生更糟糕的效果,比如只要数据量足够大,任何变量之间总能找到某种相关性。传统统计学的惊人之处在于你只需要一个很小的样本,就能对总体做出一个明确的描述。精选一个合适的样本很有可能胜过一个混乱的大数据集所得到的结果。事实上,在很多情况中,采集100%的数据得到的预测模型精度可能就比采集10%的数据得到的模型高1%不到。


大数据还处于青春期,对其下定论显然为时过早,但目前的趋势表明它与较大规模的传统数据分析截然不同。传统的统计学和数据分析方法是归纳性的——根据部分对总体进行判断;从样本来估计总体的范围;通过一些观察来给整个系统设定一种理论。与此相反,大数据看起来关心的主要是单个数据点。已知某个特定的用户喜欢某部特定的电源,那么他还可能喜欢其他哪些电影?这个问题截然不同于问哪些电影通常更可能受哪些人喜欢?


正像青春期的少年容易被引入歧途,大数据的能力也有可能被不怀好意的人所利用。翻看各种应用案例不难发现大数据的主要数据来源是人的行为——从浏览了哪些网页,到去过哪些地方,数不胜数。通过对一个个人的数据分析(而不是对一个群体的分析),可以用来做定向广告,也可以用来提高体有患大病风险者的保险价格,乃至向管理层预警有可能跳槽或者上班开小差的员工。大数据要成为一样对人类社会有用的工具,离不开一套完善的隐私保护体系,目前这方面的工作远没有达到被重视的程度。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-29 15:25:42
实际上,对于大数据究竟是什么业界并无共识。大数据并不是什么新鲜事物。信息革命带来的除了信息的更高效地生产、流通和消费外,还带来数据的爆炸式增长。“引爆点”到来之后,人们发现原有的零散的对数据的利用造成了巨大的浪费。移动互联网浪潮下,数据产生速度前所未有地加快。人类达成共识开始系统性地对数据进行挖掘。这是大数据的初心。数据积累的同时,数据挖掘需要的计算理论、实时的数据收集和流通通道、数据挖掘过程需要使用的软硬件环境都在成熟。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-29 15:39:28
当前社会经历的过程就是数据化的过程,并且衣食住行都在逐步数据化。服装品牌公司为了描述自己的服装而花费巨大,设计师、模特、灯光、摄影、后期处理、文案表述、数据库、反馈下信息等等。人们出行需要依赖数据表达的地图,寻找餐馆银行需要依靠数据建立的地图模型。公司决定策略需要详尽的市场描述,收集巨量的数据模拟的模型。借助于物联网以及个人设备;数据已经成为一种常态出现在生活中,或许很多人没意识到而已。而意识到的人就在努力掘金。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群