全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
964 0
2020-11-11
“正确显示图表:”在可视化数据时人们常犯的错误插图集
在数据真正重要的世界中,每个人都想创建有效的图表。但是,数据可视化很少在学校教授或在职培训中涵盖。大多数人在学习过程中会学习,因此他们经常做出选择或犯错,使听众感到困惑和迷惑。
从过度复杂化或过度修饰图表到传达完全不准确的信息,可以轻松避免常见的设计陷阱。我们和我的团队一起整理了这张海报,以帮助人们创建更简单的图表,以有效地理解其数据的含义。
现状:
研究人员在2014年的一项研究中“发现科学失明”,发现“只要涉及图表,大多数人都会相信您所说的话。鉴于图表的说服力,重要的是我们必须正确使用它们,并将观众的最大兴趣放在设计的核心。图表可以通过多种不同方式意外传达错误消息,歪曲事实,或者使数据难以解密(即使不是不可能的话)也难以快速解密和使用。
许多图表具有复杂而智能的基础信息,但是其表示无法传达预期的信息。Dona M. Wong-数据可视化专家
从无到有
条形图非常适合进行比较。为了判断其终点,钢筋应从零基线开始。
为了使人们从条形图中得出有意义的结论,必须完整显示条形。为此,您需要将垂直轴从零开始。
条形图通常易于阅读,因为它们“询问”我们的眼睛来做一件简单的事情:比较条形图的相对高度。但是,如果我们仅显示条形图的技巧来夸大数据差异,那么我们的观众将失去进行有用的视觉比较的能力。
“截断等于虚假陈述,” Dona M. Wong写到。因此,人们要么被误导并带走了错误的信息,要么最终不得不阅读数字,这违背了图表的目的。
扭曲的现实
折线图通常显示趋势。拉伸图形的高度会产生假的戏剧效果,而拉伸宽度可能会降低效果。
类似于拉伸或压缩的照片,图表的尺寸(或其纵横比)可以更改我们呈现的图像。但是,尽管您通常无法通过错误的宽高比来解决照片中的问题,但图表中失真的图片却很容易被忽略。无论这是导致消息夸大还是轻描淡写,它只会误导您的受众。
数据可视化专家写道:“就图形的高度或宽度而言,没有一条可遵循的规则,但有用的概念涉及'倾斜到45°',即横过图表头的平均倾斜角朝着45°倾斜。”安迪·柯克。这可能不切实际,但是通过肉眼判断往往可以解决问题。
放弃饼图
饼图看起来很友好,但实际上很难阅读。在大多数情况下,您可以找到更好的选择。
饼图是较大的面积图系列的一部分,它们都难以解释。但是,饼图在几乎每个专业和教育领域中都被广泛使用和滥用。
最好避免使用饼形图的原因很简单:我们的大脑无法准确估算或比较角度。如果切片的大小相当接近,则很难(即使不是不可能)分辨出哪个更大,而当它们的大小不接近时,您能做的最好的事情就是确定一个切片大于另一个切片,但是您可以数据可视化专家Cole Nussbaumer Knaflic解释说,无法判断多少。
用饼形图交付准确的数字需要付出很多努力,例如依赖于可能不适合的直接切片标签,或者使我们的视线在饼形图例和图例之间来回跳动的图例。
大小很重要
比较面积或体积比长度更难。为避免给人留下错误的印象,请将其作为最后的选择。
当要求我们一次判断和比较两个维度(例如两个圆圈)时,我们很少做出准确的估算。我们通常会低估较大圆圈的大小,而高估较小圆圈的大小。发生这种情况是因为我们本能地判断形状的长度或宽度,而不是形状的区域。
“尺寸计算的几何精度至关重要,” Andy Kirk写道。在构建或阅读比例形状图时,记住一个简单的规则很有用:当我们将圆的高度加倍时,实际上是其面积的四倍,而不是两倍。请记住,如果您决定使圆显示为3D球体,则不再是面积而是体积。
少即是多
“法国人只有在没有其他需要补充的情况下才能实现完美,而在没有其他需要补充的条件下才能实现,”法国作家安托万·德·圣艾修伯里说。
我们所有人在图表上犯的一个常见错误是,在图表上添加了不必要的元素。通常的怀疑是过多的色彩,图形混乱和滥用特殊效果。在我们的值中显示太多小数位是另一个需要注意的地方。这样的细节不会给任何人留下深刻的印象,但会使您的图表混乱。
图表不仅是插图,还不仅仅是绘图,它们具有意义。
Alberto Cairo-视觉和数据记者
在彩虹上
用颜色传达信息,而不是装饰。太多的颜色会造成混乱和混乱。
设计图形时,颜色既可以是您的朋友,也可以是您的敌人。根据我们的使用方式,它既可以优雅地突出显示数据并显示更改,也可以造成视觉过载并迷惑观众。
数据可视化专家Stephen Few写道:“当任何一种颜色与标准形成对比时,我们的眼睛就会注视,我们的大脑会尝试为这种差异赋予含义。” 太多的含义或颜色,只会模糊您的信息并使人们偏离正轨。
同样,对于色盲阅读器来说,使用不同的彩色元素(如条形或线条)可能会难以辨认。因此,您可以改变强度或添加符号或数字以使这些阅读器更清楚。
“您可以在家庭中收到姻亲,从而优雅地将颜色输入图表中,” Dona M. Wong说。
节省墨水
背景,边框,阴影,深色网格线和不必要的标签是您的敌人。驱使他们提请注意数据。
为了阐明这一点,美国统计学家爱德华·塔夫特(Edward Tufte)在他最有影响力的书中创造了“ chartjunk”一词:“图形的内部装饰产生了大量的墨水,没有告诉观众任何新的东西。装饰的目的各不相同-使图形看起来更加科学和精确,使显示更加生动,使设计师有机会锻炼艺术技能。无论其原因是什么,它都是非数据墨水或冗余数据墨水,并且通常是垃圾邮件。”
一种简单的解决方案是使用最少的墨水来传达您的消息,并消除所有分散注意力的内容。这样,您将使数据和图形脱颖而出。正如Alberto Cairo所说:“空白不是空的空间。”
尺寸过大
除非实际绘制第三个尺寸,否则请不要使用3D。它会使数据倾斜,并使比较困难。
大多数数据可视化专家都认为,使用3D特殊效果充其量是不必要的,最坏的情况是令人迷惑和混乱的元素。安迪·科克(Andy Kirk)写道:“这会使观看者在任何可接受的精度范围内读取值的能力受到破坏。”
精美的3D图表非常吸引人。但是,在大多数情况下,三维(或深度)纯粹是装饰性的,使人们难以处理数据。在3D图表中,后部相对于前部看起来更小,甚至被其隐藏,这使得几乎无法进行值的判断和比较。此外,人们也不知道要相对于轴比例尺测量3D形状上的哪个点。
在大多数情况下,3D图表对您和您的观众来说都是浪费时间和精力。
坚持这一点
额外的小数位看起来令人印象深刻并暗示准确性,但它们通常毫无意义。因此,在绘图之前,请先后退并四舍五入。
通过显示太多小数位来夸大数据的数字精度可能会使您的图表看起来准确,但是这种特异性只是令人误解。即使您没有夸大数据的准确性,并且您的数字确实是准确的,但过多地向受众发送此类详细信息通常是没有用的。
“为数字选择适当的精度级别可以归结为一种设计实践:精度级别不应超过满足您的沟通目标和读者需求所需的级别,” Stephen Few写道。
请记住,当使用的精度低于可用精度时,请务必使您的受众保持循环。
保持简单性
图表的全部目的在于使广泛的受众可以访问数据。这并不意味着您需要过度简化或愚蠢,而不必直言不讳,而不必太复杂。
人们在难以解释图形时往往会质疑自己的智力并责备自己。但是在大多数情况下,这不是人的错,是设计的错。
简单地做一些事情并使其变得复杂是相对容易的。进行复杂的处理并以听众可以访问的方式呈现它要困难得多。力求简单。Cole Nussbaumer Knaflic —数据可视化专家
避免谜团
文字是您的朋友。周到地使用标签意味着没有人会在黑暗中。每个图表和每个轴至少需要一个标题。
注释是使图形可访问的最简单但通常最被忽略的步骤。添加简短而相关的正确文本,可以帮助人们利用其才能来理解数据,而不是弄清楚图表。
Cole Nussbaumer Knaflic建议说:“文本在与数据通信中扮演着许多角色:使用文本来标记,介绍,解释,强化,强调,推荐和讲述一个故事。”
标签的基本类型包括出现在图形周围的图表标题,轴标题,轴标签或比例,以及标记图表内特定内容的数据标签。度量单位和数据源经常被忽略,但是当人们解释您的图形时,它们在消除猜测中也起着关键作用。只要记住,有话可以帮助,而不是从数据中夺走注意力。
关于两个故事的故事
绘制两组数据,左手一个比例尺,右手一个比例尺可能会造成混淆,并暗示可能不存在这种关系。
如果所有数据均以相同的度量单位表示,则使用公共水平轴绘制多组数据相对容易,有时会有所帮助。但是,如果他们使用不同的单位,则需要在图表右侧添加辅助垂直轴。
这种显示需要听众花费时间和精力来解码和理解应该沿哪个轴读取哪些数据。但是,即使他们解决了这个难题,他们仍然倾向于在两组数据之间比较值的大小,鉴于数据的标度和单位不同,这毫无意义。
作为一般规则,请尽量避免在很小的空间内压缩太多数据。要讲一个详尽的故事,最好使用两个或多个图表。
站次右边
表格是用于查找个人数字不错。但是,为了帮助人们进行扫描和比较,请正确对齐整数。
为了使表格能够正常工作,它必须以一种易于显示编号和逐行比较的方式显示信息。如果我们将数字左对齐或居中对齐,这将违背目的,并迫使人们在值之间来回跳动,从而难以进行幅度比较。
对于整数和十进制值,将数字向右对齐都适用。对于带小数位的值,Stephen Few建议将小数点和最后一位都向右对齐。他解释说:“这可以通过使用相同数量的十进制数字表示每个值来实现,即使它们为零也是如此。”
此外,添加数千个分隔符(例如逗号,点或空格)以将数字分解为较小的块,可以帮助人们将值存储在工作内存中并轻松发现数字之间的差异。
返璞归真
使用图表,越简单越好。为了使情况更加清楚,当您有一个或两个值时,只需显示数字即可。
我们经常问自己:我应该使用哪种图形?大多数数据可视化专家都认为,使用人们熟悉的图形形式总是更好。在大多数情况下,条形图,线形图,表格或仅是一些数字,是使用最少的工作量和最少的空间向全世界展示数据的最有效方法。
Cole Nussbaumer Knaflic强调说:“您拥有一些数字的事实并不意味着您需要图表。” 当我们尝试在图表上仅显示一个或两个数字时,媒介会从数据中夺走注意力。直接显示数字更加简单,而且确实具有影响力。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群