全部版块 我的主页
论坛 新商科论坛 四区(原工商管理论坛) 商学院
1895 0
2015-03-10

/穆胜    互联网转型论(hlw-008)首发[url=]互联网转型论[/url]

互联网时代的到来使得工业经济时代的商业逻辑很大程度上被颠覆,引发了实践者、学界和舆论对于“互联网思维”的思考。互联网思维是关于互联网商业模式设计的原则、方法组成的一套系统。这套系统有两类设计思路:一类是用户参与产品迭代;另一类是基于大数据(big data)的运用(穆胜,2014)。而在两者中,基于大数据运用设计的商业模式又占主流,而且在盈利前景上表现出了更为强劲的潜力。2012年3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略,

他们将大数据定义为“未来的新石油”。



大数据的意义可以用一个公式来说明,即“有价值信息=大数据+算法+云计算”。在商业上,有价值的商业信息包括两个部分:一是有关需求的信息,二是有关供给的信息。商业的本质在于撮合交易,如果能通过基于大数据的处理获得上述两个方面的信息,显然能够更高效地匹配供需,获得丰厚利润(无论是通过商品出售还是交易抽佣)。在当前,云计算(cloud-computing)[1]已经可以由亚马逊、阿里巴巴等超级巨头提供对外输出,对于所有商业竞争者都是公平的,那么,大数据和算法就成为了商业决胜的关键。事实上,我们通常所称的大数据是指收集、处理数据的一套方法论,包括了大数据本身和基于大数据的算法。

那么,大数据是如何推动商业变革的?商业变革又将走向何方呢?

大数据是什么?

当前,大数据几乎成为潮流和趋势,所有商业模式似乎不提及大数据就不完整。实际上,在浮躁的传播中,大数据更多成为了一种标签,其本质逐渐被忘记。

1、研究机构的声音

Gartner(前身为META Group,麦塔集团)的分析员Doug Laney在2001年的一份研究与相关的演讲中指出,数据增长的挑战和机遇有三个方向:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),合称“3V”或“3Vs”。2012年,Gartner修改了对大数据的定义:“大数据是大量、高速、及/或多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与优化处理。”另外,维拉诺瓦大学(Villanova University)的研究在在3V之外定义了第4个V:真实性(Veracity)。



在传播中,4V的版本不知不觉进行了一轮的迭代,价值(Value)被提上桌面。当前,新版的“4V”已经成为业界共识:Volume,即数量巨大,以TB字节[2]计量(涂子沛,2003),甚至有人认为应该从TB级别跃升到PB[3]级别(1PB=1024TB);Variety,即数据的种类多样,网络日志、视频、图片、地理位置信息等等都能生成数据,这大大增加了从数据中获取的商业价值,但也增加了处理的难度;Value,即价值密度低,商业价值高,处理起来好似淘金,以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒;Velocity,即要求高速处理,也有人称其为“1秒定律”。

2、学者的声音

相对于这种对大数据最直观的的描述,后来的学者更关注到大数据的运用原则。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶合著的《大数据时代》一书中,大数据被认为具有以下特点:其一,需要全部数据样本而不是抽样,即大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法;其二,关注效率而不是精确度;其三,关注相关性而不是因果关系。作者用若干例子列举了如何用大数据思维去发掘大数据的潜在价值。例如,Google如何利用人们的搜索记录挖掘数据二次利用价值,预测某地流感爆发的趋势;又如,Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;再如,Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。在他们眼中,大数据的核心在于“预测”,大数据时代是通过发现相关性进行预测,开启一场“寻宝游戏”。除了静态上对于大数据特点的关注,他们也注意到,随着系统接收到的数据越来越多,它们可以聪明到自动搜索最好的信号和模式,并用于改善自己。这显然让“寻宝”变得更加容易。



尽管同意他他们对于大数据的这种看法,另一些学者依然对于仅仅关注相关性而抛弃因果性的倾向表示了忧虑。电子科技大学的周涛教授(2013)认为,与其说大数据让我们重视相关胜于因果,不如说机器学习和以结果为导向的研究思路让我们变成这样。他进一步认为,放弃了对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。

3、实践者的声音

实践者对于大数据的认识更接近落地,描述更加直观。阿里巴巴首席战略官曾鸣(2013)直击大数据背后的“互联网逻辑”。他认为,真正的本质不在于“大”,而是在于背后跟互联网相通的一整套新的思维。他认为,大数据具有三个特点:



其一是在线,即数据在网络上,是热备份,不是冷备份,随时能够被调用,马上能被计算;其二是实时,大数据必须实时反应,对计算结果进行瞬间呈现。



其三是全貌。大数据不是样本思维,不需要进行抽样,而是包含了所有数据。

曾鸣进一步提出了大数据和传统数据管理模式的区别:

第一,知道准备达成的目标,从而主动收集这些数据,甚至要不问目的地全面记录数据就记录;

第二,贡献大数据对绝大部分人来说,完全是一个无意识的、自利的行为,是在获取信息的同时上传信息。

第三,大数据是一个双向互动的过程。输入数据到获得反馈,这是一个双向互动的正循环,双方都给对方贡献了数据价值。第四,反应速率越快,越能够创造价值,吸引用户参与,形成“黑洞效应”。

有意思的是,相对曾鸣的理解,他的同事、阿里巴巴数据委员会主席车品觉却在局部有不同看法。他在自己的《决战大数据》一书中认为,数据的收集和储存是有成本的,如果不计代价地收集数据,不仅浪费成本,更可能造成对于数据处理的效率低下。他建议应该基于目的进行数据的采集的规划,有意识地采集部分数据。事实上,在我们与阿里巴巴某高层的交流中,他也承认,随着业务的发展,阿里巴巴当前的数据量呈爆炸趋势,有目的的管理可能更具有可行性。

4、共识的总结

当前,对于大数据的理解已经在4V的基础上有了很大程度的推进,我们可以总结出如下大数据的新定义,即“3A”。

第一,大而全(ALL),大数据不仅要足够大,而且要是全貌。这进一步补充了其“大”的本质,曾鸣甚至认为“其实叫全数据比大数据更准确”。“大”和“全”都是大数据的必要非充分条件,光“大”不“全”不是大数据,光“全”不“大”也不是大数据。

第二,持续在线(Alwayson line),大数据是在线收集、及时处理、实时反馈。简单来说,就是要形成一个数据“上传-处理-反馈”的循环系统,让用户的上传具有内生的动力,让数据“跑”起来。这里面存在一个悖论:如果收集的数据较少,企业就可以越快给出反馈,但这种反馈就不够真实,甚至并不是大数据;如果收集的数据过多,企业有不能及时给出反馈,就会降低用户获得的体验,影响用户上传数据的热情。所以,现实中的企业需要平衡两类关系,使收集的数据量既能满足分析的要求,又不会成为处理的负担。当然,如果依赖云计算的数据处理能力,企业对于数据的收集量也可以迅速膨胀。另外,基于大数据处理系统的“自我反馈学习机制”,其可以利用自己产生的数据判断自身算法和参数选择的有效性,适时调整,持续改进反馈的准确性和及时性。

第三,关注未来(Aimto future),大数据从相关性中进行预测。正如维克托·迈尔-舍恩伯格及肯尼斯·库克耶所言,对于大数据的运用应该更多地关注其潜在价值,即通过大数据进行预测。值得一提的是,这种预测看似非常粗糙,不一定依赖严谨的因果关系模型,但却能够快速产生信息,即注重效率而非精准。所有,大数据是往前看的,大数据不依赖冷备份的数据,不追究原因,只关注可能发生什么。这个世界已经被彻底数据化,而基于互联网提供数据平台和云计算能力,我们能够将代表任意两个物体、两种行为的数据进行相关性分析,寻找到下一个可能发生的事件。从这个角度看,大数据是一个天然的“商业杀器”,我们甚至可以大胆预言,没有数据能力的行业专家还不如没有专业能力的数据师。事实上,我们已经通过数据来解构世界,尽管这种解构有功利主义和实用主义之嫌。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群