全部版块 我的主页
论坛 休闲区 十二区 休闲灌水
20531 109
2014-03-20

Big Data: A Revolution That Will Transform How We Live, Work, and Think
(大数据时代)
(央视《对话》节目推荐。迄今为止全世界的一本大数据专著,田溯宁、张亚勤、谢文等10位专家联袂推荐)

作者:Viktor Mayer-Schonberger (维克托·迈尔-舍恩伯格), Kenneth Cukier (肯尼斯·库克耶)

英文版出版社:Houghton Mifflin Harcourt
中文版出版社:浙江人民出版社

英文版页数:256
中文版页数:261

相关推荐:
        ·迄今为止全世界的一本大数据专著。
  ·《大数据时代》作者维克托·迈尔-舍恩伯格,大数据时代的预言家,《科学》《自然》等著名学术期刊最推崇的互联网研究者之一,“大数据商业应用人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历。
  ·《大数据时代》的译者系我国最年轻有为的大数据专家,电子科技大学互联网科学中心主任、教授、博士生导师周涛教授。这位27岁的天才型教授,数年来一直带领我国学术界在大数据研究上向国际一流看齐。
  ·宽带资本董事长田溯宁,微软全球资深副总裁、微软亚太研发集团主席张亚勤,中国互联网发展重要参与者、知名IT评论人谢文,北京云基地首席顾问、云华时代智能科技有限公司董事长郭昕,上海交通大学长江学者特聘教授、致远学院常务副院长汪小帆,中国传媒大学教授沈浩,清华大学计算机科学与技术系副主任、教授陈文光,中国社科院信息化研究中心秘书长、《互联网周刊》主编姜奇平,《财经》杂志执行主编、《哈佛商业评论》中文版主编何刚、微软亚洲研究院主管研究员谢幸等重磅推荐。
  ·大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。作者认为,大数据的核心就是预测。这个核心代表着我们分析信息时的三个转变。个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求度。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。

内容简介:
        《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
  维克托·尔耶·舍恩伯格在本书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。
  维克托洞见之处在于,他明确指出,大数据时代的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
  《大数据时代》认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们价值的应用案例。

作者简介:
        维克托·迈尔-舍恩伯格(Viktor Mayer-Sch·nberger),“大数据时代的预言家”,他是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
  他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。
  他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球企业;而他自己早在1986年与1995年就担任两家软件公司的总裁兼CEO,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。1991年跻身奥地利软件企业家前5名之列,2000年 被评为奥地利萨尔斯堡州的年度人物。
  他也是众多机构和国家政府高层的信息政策智囊。他一直专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问,同时他以大数据的全球视野,熟悉亚洲信息产业的发展与战略布局,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。
  所著《大数据》一书是开国外大数据系统研究的先河之作,而在这之前,他已经在《经济学人》上和数据编辑肯尼斯.尼尔-库克耶一起,发表了长达14页的大数据专题文章,成为最早洞见大数据时代趋势的数据科学家之一。而他的《删除》一书,同样被认为是关于数据的开创性作品,并且创造了“被遗忘的权利”的概念而在媒体圈和法律圈得到广泛运用。该书获得美国政治科学协会颁发的唐·K·普赖斯奖,以及媒介环境学会颁发的马歇尔·麦克卢汉奖。同时受到《连线》、《自然》《华尔街日报》《纽约时报》等各大权威媒体广泛好评。

  肯尼斯·库克耶(Kenneth Cukier),《经济学人》数据编辑,曾任职于《华尔街日报》(亚洲版)和《国际先驱论坛报》。他是美国外交关系协会成员,CNN、BBC和NPR的定期商业和技术评论员之一。

媒体评论:
  • 维克托·迈尔-舍恩伯格教授这本《大数据时代》,是我看到的的大数据著作,不仅对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。只要我们以开放的心态、创新的勇气拥抱“大数据时代”,就一定会抓住历史赋予中国创新的机会。
  ——田溯宁  宽带资本董事长

  • 正如迈尔-舍恩伯格教授认为的,大数据要求人们改变对性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系。这种思维的转变将是革命性的,如果企业不能认识到这一思维方式转变的重要性和迫切性,将会面临 “数据鸿沟”的挑战。
  ——张亚勤·微软全球资深副总裁,微软亚太研发集团主席

  • 过去几年,在大数据方面我读过十几本书、上百篇论文和文章。相对而言,维克托的《大数据时代》是迄今为止我读过的的一本专著,中英文都算上。
  ——谢文  中国互联网发展的重要参与者,知名IT评论人

  • 大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。一切皆信息。
  ——郭昕   北京云基地首席顾问,云华时代智能科技有限公司董事长

  • 随着大数据热潮的不断升温,相信今后几年会有更多以大数据为主题的著作问世。这本先河之作用各种案例生动阐述了大数据所带来的变革。你可以不同意书中的某些观点,但是大数据所带来的变革已经开始发生并将继续深入。我们需要共同面临的挑战是:越来越大的数据如何才能让世界变得越来越美丽?
  ——汪小帆 上海交通大学长江学者特聘教授,致远学院常务副院长

  • 我们生活在社会中,就不得不同数据打交道。我们也是数据的一部分,不论我们想不想与大数据牵扯到一起,数据都会找到我们,覆盖我们。大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在大数据中的模式、趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,都需要我们拥有更好的数据洞察力。
  ——沈浩  中国传媒大学教授

  • 大数据无疑是当前的热门话题,对产业界、学术界和教育界都正在产生巨大的影响。然而到底什么是大数据,大数据到底和过去的数据分析技术有何联系和不同?这又是一个各执一词的问题。本书的角度非常独特而深入,提出了“不是随机样本,而是所有数据”“不是性,而是混杂性”“不是因果关系,而是相关关系”这样三个关于大数据的鲜明观点,并引用很多例子加以说明,非常值得仔细研读和思考。
  ——陈文光   清华大学计算机科学与技术系副主任、教授

  • 维克托认为大数据将使人们从对因果关系的渴求转向关注相关关系,这是对人类关系结构变革的深刻洞察。因果关系通向金字塔的建立,相关关系通向扁平化的实现。大数据由此将带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中“认识你自己”。
  ——姜奇平  中国社科院信息化研究中心秘书长,《互联网周刊》主编

  • 大数据时代已经来临,先知、先觉、先行和先试者既可能率先受益,也可能率先迷失,关键在于能否看清创新方向并找到应用模式。《大数据时代》这本书最突出的价值,就在于其对商业实践的跟踪与建议。即使作者的一些预见在未来也许会落空,其大胆探索大数据商业应用的努力,仍然值得鼓励。
  ——何 刚  《财经》杂志执行主编,《哈佛商业评论》中文版主编

  • 在人们还在沉浸于讨论多大规模的数据才是“大数据”的时候,《大数据时代》这本书就“大数据时代”将对人类社会带来的革命性影响进行了深刻的分析。正如书中所述,“大数据”的本质是思维、商业和管理领域前所未有的大变革。领衔翻译本书的周涛教授是国内大数据和网络科学领域的青年领军人物,相信对不同层次的读者都会裨益匪浅。
  ——谢幸   微软亚洲研究院主管研究员

电子版资料:

本帖隐藏的内容


《大数据时代》英文版:https://bbs.pinggu.org/thread-2344869-1-1.html
《大数据时代》中文版:https://bbs.pinggu.org/thread-2605212-1-1.html

好书一起看:
分享【经管书评140320】帖子的‘标题+链接’+人大经济论坛【经管书评】到QQ群或者微博,将截图(含QQ群成员数字/微博粉丝数)回复在下面,会获赠论坛币:
1.凡分享的QQ群,人数在100人以下的,视情况奖励10-40论坛币;100-300人的,奖励50论坛币(每群限奖励一次);300人以上的奖励60-100论坛币。
2.凡分享到微博,您的粉丝在100人以下的,视情况奖励10-40论坛币;100-300人的,奖励50论坛币(每群限奖励一次);300人以上的奖励60-100论坛币。
3.所有奖励均可叠加,奖励不封顶。


【往期链接】(有奖评论分享仍在进行中)
【经管书评】创意&热情召集令
【有奖活动】★★原创书评征集令★★
《证券分析》 本杰明•格雷厄姆 / 戴维•多德
《投资经典:金融炼金术》 乔治·索罗斯
《漫步华尔街》 伯顿 G.马尔基尔

《战胜华尔街》 彼得·林奇 / 约翰·罗瑟查尔德

《史蒂夫·乔布斯传》 沃尔特·艾萨克森
《风雨哈佛路》 莉丝·默里
《股票作手回忆录》 埃德温·李费佛
《非理性繁荣》 罗伯特·J·希勒
《说谎者的扑克牌》 迈克尔·刘易斯
《彼得·林奇的成功投资》 彼得·林奇
《通向财务自由之路》 范 K.撒普
《贼巢》 詹姆斯·B·斯图尔特
《泥鸽靶》 弗兰克·帕特诺伊
《1929年大崩盘》 约翰·肯尼斯·加尔布雷思
《巴菲特传》 罗杰·洛温斯坦
《巴菲特致股东的信:股份公司教程》 沃伦·巴菲特
《引爆点:如何制造流行》 马尔科姆·格拉德威尔
《超级交易员》 范K.撒普
《聪明的投资者》 本杰明·格雷厄姆
《短线交易大师》 杰克·伯恩斯坦
《短线交易秘诀》 拉里·威廉斯

《短线狙击手》 安杰尔
互联网书单_推荐十本书
《免费》 克里斯·安德森
《平台战略》 陈威如,余卓轩
《创新者的窘境》 克莱顿·克里斯坦森
《一网打尽:贝佐斯与亚马逊时代》 布拉德·斯通
《浪潮之巅》 吴军
《孵化Twitter:从蛮荒到IPO的狂野旅程》 尼克·比尔顿
《移动的帝国》 曾航,刘羽,陶旭骏
《融合时代》 刘积仁,史蒂夫˙佩珀马斯特
《数字战争》 查尔斯·亚瑟

附件列表
大数据时代大图.jpg

原图尺寸 52.16 KB

大数据时代大图.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-20 10:52:40
你的书评是什么?回复在下面吧~~分享你的观点,同时赢取论坛币:)
分享无界限,奖励无上限!!!!

你的只言片语也许能给大家更多的帮助与思考...
网友说:
  • 大数据时代的金融投资:
        金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:   
  1)        不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些有用的信息,比如跨境汇款中的异常交易。   
  量化投资与图表派技术分析不同,用全数据进行分析,了解指标或信号在整个数据集上的统计优势,比如我们建立交易策略时就是用了10年所有股票的日内数据。
  
  2)        不是性,而是混杂性  
  大数据时代不可能实现,反之用概率说话,混杂性变成了一种标准途径。 对一个交易策略,只要透过全数据分析,在概率上他是能够长期稳定盈利的,即可被投资者考虑采纳。 而到底哪笔交易赚钱,哪笔交易赔钱,虽然投资者很好奇,但交易策略无法给出的答案,从某种程度上讲也是无意义的。
  
  3)        不是因果,而是相关性   
  在大数据时代,是什么比为什么更重要。 虽然这违背了人类好奇和探索的天性,但知道是什么对决策的帮助确实有限。  
  比如,策略预测某个模式出现后该股票有很大概率上涨,如果执迷于探究股价上涨背后的基本面缘由,则成本过高,也确实无法得出准确的原因。   
  
  大数据时代对交易策略的研发提出了几大要求。   
  1)        量化非结构的数据(unstructured data)。 比如国外的对冲基金和我们自己都曾尝试量化财经新闻,用情感度的变化帮助决策。 但至今为止,我们也没发现某个基于情感分析的策略能够带来稳定明显的收益。
  2)        数据的再利用。 Amazon利用用户的购书记录推荐新书,我们是否可以利用用户的观点和交易记录做协助学习(collaborative filtering),帮助策略作出更好的选择?
  3)        数据的重组。 把多个数据集的总和重组在一起往往能提高单个数据的价值。 这就好像除了利用股价信息,加上从财务报表提取的因子能提升预测水平一样。做好多因子分析也是我们今年重点研发的方向。
  
  大数据时代与金融投资的未来   
  1)        投资者的扁平化。 随着互联网和移动互联网带来的信息化革命, 个人投资者将能够轻松使用有大数据实证支持,低风险交易策略,投资能力将大幅提升。
  2)        金融市场更加高效。大数据时代令有盈利能力的交易策略能够被更快的发现,验证和应用,金融市场也会变得变得更加有效,起到更好的分配财富作用。
  3) 平庸的基金公司将消亡。大数据让科技公司次有机会能够挑战传统的金融分析师和交易员,利用对各种全体数据的量化,重组和整合,低成本的建立针对各个市场,面向不同用户的交易策略,让投资者能够科学稳定的在全球市场投资。 实际上,管理1200亿资产,全球的对冲基金Bridge Water已经很接近这一点,他们搜集了近百年的金融数据建立交易模型,覆盖全球外汇,债券,衍生品和股票市场,其99%的交易都由电脑决策作出。不远的将来,普通的共同基金将被根据大数据分析提供交易策略的公司所取代,留下的基金公司将是那些能够提供独特优势(alpha)的对冲基金和自营基金(如高频基金和统计套利型基金)。   
  因此,大数据时代对金融投资的革命不仅仅是未来的趋势,而是正在实现的现实,谁能做到这一点,谁就能引领金融投资的未来。   
  
  大数据时代的挑战  
  让普通人接受大数据时代的思维。 这是最难也是最容易被忽略的部分。 普通投资大众,习惯关注每只股票的输赢,关注购买每只股票背后的原因和故事。 现在,需要他们忽视这些,转而关注概率和相关性, 关注交易策略的整体表现, 这就需要金融大数据分析的公司帮助投资者完成信念的飞跃,强调量化投资在解决普通人投资不确定性问题上带来的好处:
  1) 执行上的确定性。 虽然无法告诉投资者每笔投资背后深层次的原因,但至少可以清楚的让他们了解买卖规则,在执行层面行为简单一致,节省时间。
  2) 表现上的相对确定性。 虽然无法保证每笔交易盈利,但至少可以透过历史表现让他们了解使用该方法的预期胜率,盈亏比和收益,增加安全感。
  简而言之,大数据时代承认金融市场的噪音和随机性,但透过量化和数据资料为投资者找出大概率的交易规律,从而增加操作的确定性和收益的稳定性。  
  
  大数据 VS. 理论   
  最后, 不得不说说最有争议的理论与大数据的关系。 连线主编Anderson关于“理论已死”的观点我不太认同,理论可以在交易策略研发的数据选择,建立和应用假想中起到重大帮助。毕竟,再好的大数据分析也无法替代人类创造性的思维和理解。   
  例如,在Hedge fund market wizards一书中Jaffray Woodriff描述了数据驱动的大数据分析法。基本想法是尝试千亿种适合不同市场的二次变量组合(如价格的方向和波动率),找出能预测市场位置的统计模型。 但是,即使利用此方法,其实也使用了金融的理论创建如波动率这样的关联物,同时也选择了架构合适的时间周期作为搜索的基础(Jaffray使用的是每日数据)。   
  如果只关注数据,忽视了未来不等于过去的现实,就容易犯长期资本管理公司(LTCM)当年的错误,给自己甚至整个行业造成巨大的损失。因此,在从事大数据研究时,一定要注意对找出的相关性模式进行逻辑分析和样本外测试(out of sample testing),是发现的相关性模式不仅在样本外表现稳定,而且又具备理论上的合理性,毕竟同把尿片和啤酒放在一起不同,在金融行业使用无效模式的后果是相当严重的。


  • 未知的information,已知的technology-写给未来的思维范式:
        两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买尿布。这样的发现就让超市将尿布和啤酒摆放在一起出售,从而提高利润。”
  “严谨的社会学训练”让我几乎在当时就开始思考“为什么?”“尿布和啤酒的销售量为什么会有关联呢?是因为男人们买啤酒的时候,会‘顺便’购买尿布?还是因为买“尿布”的时候会联想到‘’啤酒’?”——这使我立刻意识到在社会科学的学习中,因果关系已经成为了一种极其普遍的范式——甚至夸张一点说,所有社会科学的研究都只是为了解答一个问题——“为什么?”它面向过去,面向所有已经发生的事实,试图通过信息收集和逻辑假设来说明一个道理:”人类社会中**事情的发生,是因为**及**因素的作用。“


  我意识到,这与《大数据时代》中所提出的”大数据思维“的三个层面正好截然相反:   
  1、不是因果关系,而是相关性。大数据思维只关注”相关性“,而不再关注因果关系。也就是说,沃尔玛知道尿布和啤酒、手电筒与pop-tarts蛋挞的销量具有正相关性,就足够做出将两个物品摆放在一起销售的决策了。它并不需要去分析原因,因为只要知道这件事情”正在发生“或者”即将发生“,企业就完全能够做出正确的决定。
  
  2、“样本=全部”——不是随即样本,而是全部数据。《大数据时代》也对传统意义上的统计学构成了冲击。在这样一个我们有足够强大的数据搜集和数据处理能力的时代,样本不再是万分之一,而转变成了”样本=全部“,样本,就是万分之一万。传统意义上的统计学的随机抽样方法中有一条极其明智的真理:”采样分析的性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。”可以说,“样本分析”奠定了绝大多数科学研究的基础。而大数据时代,全数据分析的模式将全面替代“样本分析方式”。正如《魔鬼经济学》(Freakonomics)中,作者关于相扑运动员的研究,其创造性的观点正式通过使用了11年中超过64000场摔跤比赛的全数据记录来寻找到了异常性。这样的洞见,恰恰是样本分析所无法提供的。
  
  3、不是性——而是混杂性。数据量的显著增大也必然会让我们付出一些代价——一些不准确的数据会混入数据库,结果也可能不准确。这就是大数据时代的另一种思维——“不是性,而是混杂性”。 对“小数据”而言,最重要的要求就是减少错误。而在大数据的采集里,在技术尚未达到完美无缺之前,混乱是无可避的。虽然我们得到的信息不再那么准确,但收集到的数量庞大的信息让我们放弃严格的选择变的更为划算。从谷歌翻译系统中可以看到,它收集了上万亿的语料库,来自未经过滤的网页内容,可能会含有不准确的用法、语病,未必每一条语料库都非常“”,然而这个语料库是布朗语料库的几百万倍大,这样的庞大规模优势完全掩盖了它的缺点。也就是“大数据的简单算法,比小数据的复杂算法,更加有效”。
  
  总体而言,大数据时代透露出三个特征——更多、更杂与更好。它面向未来,要做的事情是关于“预测”。正如作者所说"大数据要求我们有所改变,我们必须能够接受混乱和不确定性。性似乎一直是我们生活的支撑,就像我们常说的‘钉是钉,铆是铆’,但认为每个问题只有一个答案的想法是站不住脚的,不管我们承不承认。一旦我们承认了这个事实,甚至拥护这个事实的话,我们离真相又近了一步。“
  
  当我们用”物联网“去开始测量、记录、分析,世界,并将我们的世界”数字化“的时候,Information Technology,信息技术的变革,就将聚光灯转向了Information的身上。
  从三千多年前会计学的诞生开始,人们将大量的经济活动”数字化“。然而,”数字化“只是为”数据化”拉开序幕。
  在google的数字图书馆中,”文字“也已经被“数据化”,人们可以检索、对比、发现不同的词组在几十年来中含义和运用的沿革。人可以阅读,机器也可以分析。
  在Foursquare和街旁网中,“方位”也已经被“数据化”,在我们喜爱的地方”check-in“,我们通过忠诚度计划、酒店推荐和其他计划得到好处。
  在Facebook或twitter的里,"沟通"也已经被“数据化”,伦敦的金融公司通过分析每天的Twitter的大量数据,以作为股市的投资信号。
  
  而更令人兴奋的是,”数据"作为一种资源,本身是一种非竞争性的资源,它的价值并不会因为被使用而减少,相反,它可能被通过不断地重复使用而产生出更高的价值。数据本身的价值,是它所有能够产生的可能选择的价值的总和。书中提到了几种数据创新:
  1、数据再利用。数据的运用者常常不是那些拥有大量数据的机构,却是那些恰好可以用这些数据来支持其商业模式的机构,这就是“再利用”
  2、重组数据:将多个数据集的总和重组在一起时,充足总和本身的价值也比单个的总更大。丹麦的癌症研究就是将所有的癌症患者和手机用户的数据结合起来,从而揭示两者是否有关联性——幸运的是,全数据显示并无关联。
  3、可扩展数据。譬如,零售在店内安装的监控摄像头,不仅能认出把手,也能跟踪经过商店的客户流和他们停留的位置。
  4、数据的折旧值:随着时间的退役,大部分的数据都会失去一部分基本用途。然而,即使数据用于基本用途的价值会减少,但选择的价值却依然强大。从这个角度,组织机构应收集尽可能多的使用数据,并保存尽可能长的时间,同时也应当与第三方分享数据,保留所谓的“延展性”权利。
  5、数据废气:在拼写检查中,用户会有大量的错误拼写。这些数据看起来是废品,但收集在一起却能够锻造成一块闪亮的金元宝。例如,当couresa这样的网络平台中一个班级数量超过万人时,教授发现2000个学生在作业中犯了同样的一个错误。修正后,系统将会提醒以后犯同样错误的学生。通过这些’错误“,我们改变了教育的方式。
  6、开放数据:政府只是收集信息的托管人,而数据应当对全球开放。
  
  在大数据价值链上,会有三种不同的大数据公司,种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。从我的理解来看,种人,拥有金矿的矿山。第二种就是数据分析师,也可以说,拥有开采、提炼金矿的技术。第三种则是加工金矿的人,把金矿做成金元宝、首饰,通过创新思维让数据具有商业价值。在大数据时代的早期,思维和技能是最有价值的,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘,也就是说——金矿本身才是最值钱的。
  
  然而,大数据背后带来的也是重重隐忧——从我们的隐私不断暴露,个人在网络上留下的千丝万缕的踪迹似乎让人们又回到了”老大哥在看着你“的那种担忧。”“数据统治”的登峰造极从哲学上会抹杀人的自由意志和选择的可能性,正如,基于你以前的各类数据分析,陪审团断定你以后将会犯罪。那将是人性面对技术的一次溃败。
  
  阅读《大数据时代》的过程,总是让我不断地想起库恩《科学革命的结构和范式》。毫无疑问,大数据带来的是思维范式的根本性变革——我们将不再沉湎于历史和过去,试图解释某种联系,而是更好地觉知当下,与正在发声的未来。



  • 你已经体验到的大数据时代:
        你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。  
  因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录自己的电脑上软件的时间,曾经一度从运营商后台保存着自己话费详单背后的电话和短信记录,有时也会打开Outlook上的插件xobni,来看看过去一段时间自己邮件又有怎样的走向,或者有什么惊奇的事情发生……而这些数据,对自己来说,当他们没有被挖掘的时候,几乎不会产生特别重大的意义。   
  但当我们拥有更多的数据时候,我们最重要的是从这些数据中找到对于我们有意义的东西?也许我们个人无法完成,但是已经有很多前瞻者做出了很多的尝试。  
  最早对数据或者信息特别有感触的时候,是看《当我们变成一堆数字》一书时,我们每个人都在产生大量的数据,而作者则在探究,我们这些数据都在被谁所用,我们自己又可以做什么?至今还印象深刻的一个例子,是通过地板上的测量仪器,随时了解在房间内的人的各项生理信息,而这对于照顾老人则极其有帮助,如果发现一些异常信息,则可以及时提醒来保障生命。   
  还有一篇比较记忆深刻的文章,是同人于野 的“数字如潮人如水”(http://www.geekonomics10000.com/463) 商业机构通过对每个人数据的掌握,通过自己的算法,为你提供更好或者个性化的服务,亚马逊、Netflix即是如此,其中也简单的提到了Faercast这家让消费者可以逆袭来购买到更便宜机票的公司(目前已被微软收购,整合到Bing搜索中,不过只提供美国的预测,在《大数据时代》中,作者有更多的介绍)。   
  后来当我们走进微博这样一个充满数据的虚拟社会时候时,通过李开复的一条微博,知道了惠普研究院正在做的研究一项,他们通过抓取Twitter的300万条tweet数据,基于情感分析,来预测一部电影的票房收入,而结果也是惊人的准确。另外时至今日,没有听到过基于新浪微博特别成熟的应用案例。(而我也相信,如果在上映前就进行预测是一件极其不靠谱的事情)  
  当看到更多零散的信息,让自己知道Netfix的推荐竞赛,通过Twitter不仅可以预测电影票房、预测股市、流感的传播,还有塔吉特给怀孕少女寄送相关的优惠券等等,虽然我相信这是我们不远将来会被大规模应用的事情,但还没有人说,这就是大数据时代,也许这正是大数据时代的前传。我们对数据和信息可以带给我们什么充满了期待。而这种期待,也很快随着“大数据”一词的扩散,慢慢的变成现实。   
  进入2012年后,大数据的呼声便开始此起彼伏,无论是科技博客,还是各种业内人士,抑或行业论坛,媒体专题,都会有大数据的相关探讨,但对于自己来说,如果没有见到一本书,或者一个非常系统的系列文章时,很难对“大数据”有更加细致的认识。   
  但当看到这本书时,将许久之前的些许了解都串联了起来,Viktor从大数据时代的思维变革、商业变革、管理变革三个大的角度为我们进行了阐述。   
  思维上,从大数据时代我们关心的是全部数据,面对如此之多的数据时,我们可以不那么热衷于性,在前两个因素之下,我们不再热衷因果关系,而更注重相关关系。初听起来也许觉得作者太过于,而且很大程度上挑战了我们一贯固有的思维模式,但是在文中作者就大数据时代的特性充分阐释,并告诉我们为什么现在的“大数据”应该是这样?而我们可能关心的部分,又为何不那么重要,或者需要等待更久去实现。
  
  其次在商业变革上,作者从数据的前世今生说起,我们获取的众多数据从何而来,无论是百年前的航海日志,还是到目前一切事物的数据化。而当我们有了这些数据时,又可以如何利用?我们可以将数据重组利用,还可以通过提高扩展性获得新的用途,甚至在遇到陈旧数据时,我们要有所取舍,比如推荐系统中对于较早数据的舍弃。特别“数据废气”对于提高整个系统的服务性有极大的帮助,同时也期待更多数据的开放。  
  当有了数据还有使用方法的时候,我们最不能忽视的就是大数据时代的大数据公司,比如Twitter这样的数据提供者,还有将数据进行分析基于数据分析能力的公司,还有一类便是基于非常出色思维的公司。而Viktor特别说的一点是,大数据时代,超大型公司占据规模优势,而小公司则独具灵活性,处在中间的公司要么进行转化,要么面对更加残酷的竞争,直至破产。
  
  然后在管理变革上,感受最深的还是大数据时代个人隐私的控制与风险,当我们有更多的个人信息被透露时,通过大数据,我们能知道隐藏在数据背后的你是谁,甚至你心里在想谁。无论是数据的告知与许可、关键数据的模糊还是匿名处理,很多用户的隐私已经受到了威胁。当然不出意外,在现实中的例子有很多,如研究人员通过匿名数据进行研究时,我们依然可以通过一些独特的数据关联,然后定位到个人。Netfix公司的匿名数据还是被用户认了出来。在大数据时代,这个时候我们已经不能放心期待拥有数据的公司不作恶。但作者也为我们的隐私提出了解决之道,让数据使用者承担更多的责任,避免数据独裁。而这些大数据的不利影响也会随着大数据行业的发展而得到控制。
  
  事实上,大数据的应用已经遍地开花,书中上百个例子如医疗及公共卫生行业,乔布斯通过大数据辅助癌症治疗,通过智能手机上的应用程序来监测病人的身体颤动,甚至如丹麦癌症协会通过大数据来研究手机使用是否致癌,还有微软这样的公司来分析病患的再入住率等,在互联网行业,让你非常讨厌的ReCaptcha验证码,Google翻译的进化,Zynga通过数据分析修改游戏等我们日常使用的服务及产品背后的大数据。金融行业通过大数据来鉴别个人的信用风险,快递领域通过数据来确定行驶路线,减少等候时间,政府通过大数据来找出最容易发生火灾和井盖爆炸的地点,商场通过大数据发现产品之间的关联,比如最近大家在探讨的为什么避孕套和口香糖要放到收银台附近。大数据时代,一切的一切都存在着可能,而这一切的改变我们也正在体验之中。
  
  回过头来,再回答大数据是什么?Viktor的答案是“大数据就是我们可以在更大规模的数据上做到更多我们无法在小规模数据基础上完成的事情。”你认同吗?
  
  很喜欢结语的那个题目,“已经发生的未来”。其实无论如何,人类总是希望自己掌握更多的数据,更加了解自己,而事实上,大数据时代,一切的迷雾都将会拨开。而这本书已经开始将我们对于“大数据”上的迷雾抹去。
  
  引用谢文老师的一句话,这是“迄今为止,世界上的大数据专著”,如果你关注大数据或者关注未来人类的未来,这本书值得一读再读。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-20 10:56:32
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-20 11:16:51
多些楼主分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-20 11:32:27
x谢谢楼主的分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-20 11:46:00
谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群