误导图第2部分:梯形图,意大利面和其他破坏图的方法
如果您花了很多时间对数据进行建模,那么您会知道在数据表示方面有很多陷阱(我在误导图第1部分中解决了一些常见的陷阱)。误导图可能是由于数据收集不正确,对数据表示的基本“规则”(如标签轴)不了解,甚至是故意误导的结果。第四个陷阱更加细微:尽管尽了最大的努力,但是您可以通过呈现数据的方式来淡化信息。
这些示例说明了混淆一条简单消息是多么容易。
那是一个非常不错的阶梯,但是...
我想知道这个问题的答案:要幸福我需要多少收入?
我一直以来都是我最喜欢的研究之一, 获得诺贝尔奖的经济学家安格斯·迪顿(Angus Deaton)和普林斯顿大学的同事丹尼尔·卡尼曼(Daniel Kahneman), 高收入改善了人们对生活的评估,但改善了人们的情感健康。研究小组调查了多少钱是幸福的“甜蜜点”。让我们看一下本文附带的图表。我注意到的第一件事是“梯子”(毕竟,它是BOLD的焦点):
图。1。
我以为该阶梯(和“ y轴右侧的平均阶梯”)与公司阶梯有关(因为我们在这里讨论收入),但我完全错了。据作者说,阶梯实际上是“” 。 ..在0到10的比例尺上报告的平均数字,在右边的比例尺上标出。”因此,它不仅看起来根本不像梯子,而且听起来也不像一个梯子(您知道什么梯子(以0到10的比例标出)吗?在讨论该比例时,请注意作者提到的是0到10,但图表上的比例从5.5变为6.5。为什么要减少比例?如果知道梯子撞到了哪里(大概几美元的收入),您就不会在此图上找到它。
但是,在我们进一步思考该阶梯之前,请不要忘记,我们在这里要找出我们需要多少钱才能幸福-而不是破译阶梯的目的。阶梯对我来说是一个很大的干扰,很可能会分散您大部分观众的注意力。要点:不要在没有充分考虑读者的设想的情况下将梯子,水桶,马匹或其他强烈的图像放在图表中。
手段,分数和意大利面条
但是回到眼前的问题。“最幸福的收入水平”埋在上面的图上的分数和均值下,外加9条不同线(包括2条y轴!)的意大利面连接点。根据《卫报》的报道,有五分之一的成年人忘记了如何进行分数计算,甚至更少的人忘记了如何计算均值。而且,如果美国人的平均阅读水平达到八年级, 您公司中的普通人是否能够从像这样的图表中找到答案?可能不是。
如果我看一下图表并猜出魔幻数字可能是多少,我可能会选择“阶梯”和“正效应”的交集:60
首字母缩写词和其他Gobbledygook
莱特(L et)看了另一个图,它产生了类似的问题。
同样由安德鲁·杰布(Andrew Jebb),路易斯·泰(Louis Tay),埃德·迪纳(Ed Diener)和大石茂宏( Shigehiro Oishi)撰写的第二份研究报告的 标题为“ 世界各地的幸福,收入满足和转折点 ”。
图:由Richard Carrier提供
(侧栏:也许奇怪,我注意到此图的第一件事是,与本文中的第一张图不同,水平轴已正确标记(带有$符号)。这是一个小而重要的注意事项:请确保轴已标记!)
我仍在寻找一个简单问题的简单答案。我没有从这张图中得到它。
它有很多首字母缩写词。 “ AUS”是一个世界观的线索,但就我所知。我必须咨询Google以确定EE,SE,AF和LA代表什么。厄立特里亚,新加坡,阿富汗和路易斯安那州突然出现。是的,我知道路易斯安那州不是一个国家,但生活在路易斯安那州附近(我在佛罗里达州),我的大脑看到了洛杉矶并发射了路易斯安那州的神经元。如果您像我一样受到首字母缩写词的挑战,正确的答案是爱沙尼亚,瑞典,阿富汗和老挝。与花时间寻找问题的答案相比,我花了更多时间尝试疯狂地追逐Google找出那些代表的含义。我确定研究中已经解释了代码,但是应该将它们放在图表上。
现在获得清晰的图表
来自Slate.com的下一张图不需要解释。
超过10万,每个人都很高兴。一个简单的图表,一个简单的问题,而不是眼前的大雁。它可能不会成为学术期刊,但是作为数据科学家,这可能不是您的目标。
此示例说明了呈现数据时会遇到的一些陷阱。作为数据科学家,您可能将中继技术性,特定于行业的信息,或仅仅是枯燥乏味的信息。您需要采取这些无趣的细节,并以一种有趣的,信息化的方式呈现这些信息,每个人都可以快速地理解它们,而不必参考其他来源来理解您的演示文稿。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!