经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
JMP论坛
如何在JMP中给箱线图(Box Plot)快速着色
楼主
JMPer
11357
3
收藏
2019-12-19
箱线图(Box-plot),是大家耳熟能详的一种显示数据分散情况的统计图。通过箱线图,我们可以很容易地比较几组数据的形状,识别数据中的异常值,锁定那些需要我们关注的异常值信息,发现解决问题的机会。
箱线图的用途十分广泛。比如半导体工艺生产过程中的过程能力分析 ,通过箱线图将复杂的
统计分析
以简单易懂的方式展现出来,可以帮助工程师清晰直观地查看生产过程中的变异;在药物的临床试验阶段,可以通过箱线图轻松检查风险指标的分布,方便临床医学研究人员基于风险开展进一步的监查与分析。作为可视化工具中工程师和分析师常用的一种图形,箱线图深受大家的喜爱。但在数据量庞大图形众多,特别是在诸多分组同时展示在一张箱线图的情况下,清晰的颜色界定就非常重要了。接下来我们看看在JMP 15中给箱线图着色。
JMP14中箱线图的着色
在过往我们收到的问题中,如何给箱线图添加想要的颜色一直是经常被问到的话题。在JMP15之前的版本中,比如JMP14中,给箱线图着色唯一的方式是右键点击图形上的“定制… “菜单选项来实现。
“定制图形”对话框显示了图形中每个箱体和离群值的条目,你可以按照如下设置线条的颜色和其他一些属性。这种方式对于突出显示某个箱体或者少部分箱体的信息时非常有用。但如果分组变量非常多的话,工作量就会变得巨大。
定制箱线图颜色
庆幸的是,JMP 15 中新增了控制箱线图颜色和大小的新方法。
JMP15中箱线图的着色
在JMP 15中,图形生成器中“颜色(Color)”变量区域功能进一步增强,现在支持以连续变量和分类变量作为“颜色”变量选项,让你能够创建更具表现力的箱线图,同时提供了更多的可视化信息可以指导你开展更深入的数据探索过程。
这里,我们运用作者个人日常锻炼所收集的数据集来简单展示一下箱线图的新功能。从下图的表头可以看到,数据表包含了跑步日期、时间、距离、时长、速度和天气等一系列信息。
个人锻炼数据表
JMP15—以连续变量来着色
在下面的示例中,箱线图显示了“跑步距离”和“星期”相对应的关系。不出所料,统计分析表明,星期天通常跑步路程最长。然后,将“速度”拖入“颜色”变量,其他关系也立马清晰可见。可以看到,跑步距离最长的星期天也是速度最慢的。星期一往往也会比较慢,可能是因为周末的劳累延续到了周一。而一周中跑步最快的时候通常在星期四,这也许与作者有意提升速度不无关系。
跑步距离 VS 星期几,以速度来着色
上图中,速度变量使用中位数汇总。当然了,你还可以通过颜色功能区右单击“汇总统计量”更改为任意标准JMP汇总统计。
JMP15—以分类变量来着色
颜色变量也可以是分类变量。下图是在JMP14中我们再次研究跑步距离与星期的关系,但你可能已经注意到了,现在y轴上有了额外的嵌套:月份和星期,这让图形变得更加繁多和复杂。
无颜色区分的嵌套式箱线图
这时,将众多的箱体与相对应的星期匹配起来就很困难,因为箱体较多且密集,令人眼花缭乱。眼睛必须盯着箱体的直线仔细往左看,才能找到相对应的星期和月份。
在JMP15中,一切都变得简单且高效。通过使用不同的颜色标注不同的分组信息,一目了然地可以看出每组数据在所有数据中所处的位置、哪组数据相对性能较好等信息。这里我们将“星期”放入颜色变量,就很容易确定箱体所代表的日期。同时,在各月份之间比较同样的时间点时也更容易,因为我们可以只关注一种颜色,而不必回到轴线上再作参考。
用分类变量着色的箱线图
例如,我们知道了星期天是蓝色,并且月份自下而上是按顺序排列的,这样就很容易识别并比较6月的星期天和7月的星期天,而不必通过查找第六和第七个蓝色箱体来查看轴线。
定制箱体的宽度
除了增强的着色功能外,箱体的宽度现在也可以调整了。箱线图上一个新的选项——宽度比例可用于指定箱体的宽度。
默认情况下,该选项设置为0,也就是自动宽度。在JMP15中,你可以更改这个数值为0-1之间的任意数。
下图是一个宽度为0.1的狭长箱线图的示例:
箱体宽度设为0.1
此外,你也可以设置这种宽度为0.95的超大箱体:
箱体宽度设为0.95
当然,这仅仅是一种美学上的改变,但如果你也想打造一款既实用又美观的个性化箱线图,不妨如法炮制试试看。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
nkunku
2019-12-20 10:30:44
楼主您好!很高兴在微信您推送的帖子以及您这个网站上的帖子,为我们展示了JMP 15上这种新的箱线图着色方式。我前段时间也下载了试用版(还有7天就要到期了)。我自己随意产生了星期一到星期日共7*250个数据,但都不能画出如您这个帖子里那样漂亮的图形。后来经仔细查看您上面Runninglog的数据,才发现原来我的数据构造太简单了。所以,您能不能把Runninglog数据给我们大家下载,供大家练习呀?谢谢!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
JMPer
2019-12-23 09:24:32
RunningLog.zip
大小:(41.18 KB)
马上下载
本附件包括:
RunningLog.jmp
数据已经附上,供参考。这个增强功能是在JMP15中才有的,你可以试试看~
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
nkunku
2019-12-23 14:55:17
谢谢。我刚才拿着这个数据集试了一下,虽然没有楼主做得这么漂亮,但已经增色不少。只可惜剩余的试用天数不多了,呵呵。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
栏目导航
JMP论坛
市场行情分析
金融学(理论版)
IT基础
马克思主义经济学
学术资源/课程/会议/讲座
热门文章
交易行为的心理偏差
从华夏到中国(刘仲敬)
当Stata遇上 AI 智能体:你的实证研究,正在 ...
从数据仓库到智能取数:CDA数据分析师视角下 ...
相对于Harness这个词,我更钟情控制论:从控 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CDA数据分析脱产就业班在2026年3月7日开班了 ...
Expert Choice软件(ahp层次分析法软件)含序 ...
GraphPad Prism 多因素方差分析
人工智能行业:2026年AI+行业场景落地选型指 ...
推荐文章
【文献求助专区】版主工作备用贴
五一充电,学术突围!四大AI赋能王牌课程, ...
关于学术研究和论文发表的一些建议
几种免费下载文献的方法----我的文献应助经
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群