全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
3520 0
2014-09-01

导读:当今的现实

我们现在都生活在资讯设计的轰炸中。这些信息通过网路涌入眼帘,我们都在将其视觉化;我们都在要求我们接受的信息中包含视觉信息...如果你在信息的茂林中穿梭时遇到了优美的图表或可爱的视觉化数据,那感觉就像在丛林中发现了一块空地一样,让你长舒一口气。——大卫•麦克坎德雷斯David McCandless

<p在当今这个错综复杂的“信息丛林中”,大卫•麦克坎德雷斯观察到“数据是一片新土。”作为数据记者和信息设计师,他将数据尊崇为一种无处不在的资源,为新想法新理解提供创意丰厚的滋生土壤。麦克坎德雷斯的灵感来源,统计学家汉斯•罗斯林,把这个比方引用到他自己的tedtalk中,用信息土壤中开出花朵的图像来增强说服力。这些“花朵”代表了能够从有效的可视化数据当中提炼出的许多深刻见解。

我们正在学习如何耕耘这片新的土壤,让不断产生的海量数据变得可以理解。正如哈佛大学量化社会学院主任盖瑞•金(Gary King)在他发表在《纽约时报》的文章“这是一个大数据时代”中所言:“这是一次革命,我们才刚刚开始。量化的大踏步前进,在众多新数据来源的推动下,将横扫学术界、商界和政界。没有任何一个领域能躲得过。”

金融时报总编辑在CNN的Your Money中说:“会用精密实用的方法分析数据的人都将找到很好的工作。”会用有效方式展现数据的人,不管哪个领域,都将成为不可多得的人才。

提起数据,很多人想到的是填满了数字的表格。但是这个存在已久的概念正逐渐消失。今天,我们所生成的数据流经常复杂到无法用一个简单的“表格”来呈现。BlaiseAguera y Arcas的TEDTalk探索了图像数据,Deb Roy则把社交媒体中的音频、视频和文字信息作为数据。

一些人也会认为只有少数专家才能从数据中分析得出深刻结论。然而,当我们正确观察数据的时候,结果往往是十分有趣、引人思考、甚至出其不意的,当然,也是人人都可以做到的!

导读:无处不数据

我们能处理的数据远远不及我们可使用数据的数量。举个例子,商业情报公司DOMO制作了一个图表来演示网络用户每一分钟向大数据池中添加了多少信息:

  • 204,166,667 封发送出的电子邮件
  • 超过 2,000,000 次Google搜索
  • 684,478 条Facebook新增内容
  • $272,070 网络购物消费额
  • 超过 100,000 个Twitter发贴
  • 47,000 个Apple应用下载
  • 27,778 条新增Tumblr博客发文
  • 3,600 张Instagram新照片
  • 2,083 次 Foursquare签到
  • 571 个新建网站
  • 48 小时新上传YouTube视频

在你阅读这些数字的时候,它们肯定已经更高了。而这只是人类所产生和储存的数据的一小部分。不仅在网络上,无论在做什么,我们都留下了数据轨迹。这包括大量的金融数据(信用卡账单,商业文件,华尔街信息),世界人口数据,天气环境气象数据,记录我们消费的零售数据,食物和饭店的营养成分数据以及各种体育数据等等。

政府通过数据搜寻恐怖分子的图谋,零售商运用数据优化营销策略,健康组织运用数据追踪流感传播情况。但你有没有想过收集自己孩子生命里每一分钟的数据?那恰恰是Deb Roy做的。在他儿子出生的第一年里,他录制了9万小时的视频和14万小时的音频。这可都不是小数字!他和他的同事现在正用这些数据来了解儿童怎样学习语言,他们并把这一研究扩展到分析社交网络上公开可见的对话,这将允许他们把握“一个国家的实时脉搏”。

数据为我们提供对世界的崭新和更深了解。它帮助我们打破成见、促成理解。但数据量的庞大,哪怕仅涉及一个小领域,也让人觉得难以招架。有什么妙法让这些数据变得易于理解呢?

导读:可视化数据的力量

视觉化可帮助把海量数据转化为有用信息。麦克坎德雷斯在他的TED演讲中说道,视觉是人类五大感观中处理信息速度最快、数量最大的。看似不可参透的数据可以通过图片、图表,甚至是电影而获得生命。汉斯•罗斯林告诉我们:“当他们真正‘看到’数据,学生——政府官员和企管人士也不例外——都变得十分兴奋。”

不难理解,如果我们能有效地视觉化数据,更多的人就能接触理解它们。然而,我们是否需要担心在将数据压缩成图表时,过度的简化会造成数据重要特征的流失呢?让我们来看一看学者埃姆雷•索伊尔EmreSoyer和罗宾•霍格尔斯Robin Hogarth的有趣研究。研究对象是对数据毫不陌生的经济学家,三组经济学家分别回答了有关一组数据的同样一个问题:


  • 一组经济学家拿到的是数据和数据的标准统计分析,72%的人给出错误答案
  • 另一组拿到的是数据、统计分析,以及一张图表,答案错误率仍有61%
  • A third group was given only the graph, and only 3% got the answer wrong.
  • 第三组只拿到图表,仅有3%的人回答错误

视觉化数据有时比原始数字和统计分析更减少误读!

那我们之中不是专业经济学家或者统计学家的人呢?娜塔莉•米巴赫Nathalie Miebach发现,将数据转化成艺术为人们提供了另一条进入科学世界的途径。她将大量气象信息转化成可触实体构筑物和音乐乐谱,让数据变得可感、可听,从而更有力地增强对数据的理解。

另外一位艺术家克里斯•乔丹Chris Jordan关心我们对大数字的理解能力。乔丹的艺术旨在帮助我们理解这些数字,尤其是那些与上瘾和耗费问题有关的数字。比如说,乔丹指出,美国是世界上监狱人口比例最高的国家:2005年,全美监狱共有230万名犯人,而这一数字还在上升。因为我们的大脑无法真正理解这样一个庞大的数字,乔丹的艺术作品便让它变得真实。

导读:优秀视觉化的重要性

创造性,甚至是艺术能力,帮助我们用新眼光看待数据。当有趣的数据遇到有效的设计——当统计学家遇到设计师(有时二者恰为一人)——奇迹就发生了。呈现数据的方式有好有坏,TEDTalk中就有很多好的例子。

但是,有时数据视觉化也会不起作用甚至引人误读。比如说,一个不恰当的测量尺度就很有可能错误放大一个微小差别的重要性,又或者,一个过于复杂的展示有可能混淆数据间的主要关联。统计学家凯撒•方Kaiser Fung的博客Junk Charts就提供了很多失败的例子(其中也有成功案例),这些例子都配有相关描述,帮助读者理解导致数据展示成败的因素。如果想了解更多案例,可以访问安迪•柯尔克Andy Kirk的博客visualisingdata.com.两个博客都一贯列有取自最新来源和事件的案例。

生活在互动和动画图表越来越普遍的时代,我们很幸运,这些工具可以变得非常有影响力。通过调节颜色、大小、定位、动态和声音来发现展示数据的核心特征,使普通人也可以轻松读懂数据,做到这点是一项挑战,它很大程度上依赖于日渐复杂的科技。

本系列的TEDTalks在不同程度上依赖复杂的科技来收集、储存、处理和展示数据。处理大量信息(例子:大卫•麦克坎德雷斯追踪了Facebook上1万条身份变化信息,布雷斯•阿奎拉•阿尔卡斯将几千幅圣母大教堂的图片协调汇总,而戴博•罗伊则在9万小时的视频录像中搜寻个别词汇)需要使用专为处理海量数据而特制的最前沿电脑计算工具。

导读:让数据改变你的认知

虽然各种图表和绘制图可能会引起误读,但我们最终还是能找到“数字中的真相”。正如史蒂芬•乐维特Steven Levitt和史戴分•杜伯纳Stephen Dubner在Freakonomics上说:“教师、罪犯和地产商可能会说谎,政客甚至中情局的分析师都不一定言尽为真。但数字不会说谎……只有数字有这样强大的力量,能够解开层层疑惑和矛盾。”

数据帮助我们理解真实的世界是什么样子,解除我们固有的成见。汉斯•罗斯林展示说,影响我们认知世界的其实并不是缺少了解,而是一些先入为主的观念。公开的数据可以改变我们的世界观,罗斯林鼓励我们去“让数据集改变思想”。

克里斯•乔丹展示的关于废弃物和毒瘾的有力的图像促使我们不再否认,而是去面对现实。很多事实我们都是听过就忘了:每六个小时,我们仅在飞机上使用并废弃的塑料杯就多达1百万个。而当这些震撼的图像呈现在我们眼前是,我们对事实的反应就上升到了完全不同的层次(而那些在飞机上被扔掉的杯子在我们眼里也不再一样了)。

洞察数据的能力扩展我们对世界的了解,而且我们在这条路上刚刚开始。计算机模拟使得我们能够看到疾病如何传播,森林大火怎样被控制,恐怖主义网络怎样交流。我们增进了对这些事实了解,这些是几十年前我们预想不到的。当阿尔卡斯展示Photosynth技术时,我们似乎看到了未来。通过把网络上搜集到的用户产生的数字图像联结起来,他创造了可导航的“地球上每一件有趣事情的丰富视觉模型”,这些模型来源于我们所有人共同的记忆。罗伊对语言的研究也相似,他利用社交媒体上的公开信息分析全国和全球的对话趋势。

罗伊对这一切的总结十分震撼:“现在应运而生的是一种能够看到前所未见的、新的社会结构和动向的能力……它对科学、商业、政府,尤其对我们每一个人,都影响深远。”

接下来

让我们从大卫•麦克坎德雷斯的TEDTalk开始。自称为“数据侦探”的他讲述如何通过艺术化的展示来强调数据中隐藏的模式。


网址:http://v.163.com/special/visualizingdata/

</p在当今这个错综复杂的“信息丛林中”,大卫•麦克坎德雷斯观察到“数据是一片新土。”作为数据记者和信息设计师,他将数据尊崇为一种无处不在的资源,为新想法新理解提供创意丰厚的滋生土壤。麦克坎德雷斯的灵感来源,统计学家汉斯•罗斯林,把这个比方引用到他自己的tedtalk中,用信息土壤中开出花朵的图像来增强说服力。这些“花朵”代表了能够从有效的可视化数据当中提炼出的许多深刻见解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群