经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
JMP论坛
数据图表应用:强大的散点图(转)
楼主
lianqihappy
3768
2
收藏
2016-04-20
报告是位花姑娘,图表是件花衣裳。姑娘不仅要穿,还得懂得怎么穿!
n进入主题:
强大的散点图
很多人听到这会说,散点图很简单啊,感觉平时用不上。真不是你想的这么简单。耐心的孩子听我慢慢说。
首先,散点图确实能很直观的反应两个变量之间的关系。
案例一:利用散点图观察不同来源流量与网站总流量的关系。
上图展示了某公司主站的新访客各来源渠道与总新访客量。结论很直观:direct(直接访问来源)和organic(自然搜索来源)和总的新访客有明显的正相关关系(direct与newuv相关系数达到0.89,direct来源的占比达到60%)。因此,我们知道这个公司大部分访客来源于口碑,而且其潜力还相当大,因为direct和organic图显示新访客对direct的弹性比较高,没有出现像sem(蓝色)图那样的边际效益递减的情况。
(一些名词解释我会在文章最后列出)
通过组合型散点图,我们已经得到了一些有价值的信息。我个人对sem来源的变化趋势非常感兴趣。针对这点我们继续挖掘信息。
案例二:在散点图上用颜色增加一个分析维度,并添加平滑趋势线。
图中,我将sem来源的访问量按四分位数进行了分层,配合局部加权多项式拟合线。似乎又有了新的收获:
1.sem来源流量较少时(红色和绿色,后50%),与总流量的正相关关系是比较明显的。
2.sem来源流量在75%到50%分位数(绿色)之间非常集中。我猜测,使sem流量维持在这个水平的投放策略,看来是有一种粘性的,即便加大投放,在一定幅度内,sem的流量增长也不明显,直到突破某个临界值,进入蓝色和紫色区域后,才会松开。
3.较高sem流量(蓝色和紫色,前50%),与总流量的关系非常弱,拟合线几乎平了。
到这里,您可能会这么问:sem流量在什么程度才是最优?
要衡量这个问题,我选取了sem投放总成本,sem单位点击成本(cpc),和sem来源的注册转化率三个指标。让可爱的散点图升级!
案例三:点的大小衡量一个新的指标,散点图进化为气泡图
气泡图,就是除了横纵坐标轴,点的大小还能衡量一个变量的散点图。上图不仅衡量了sem投放总成本(semCOST)和sem来源流量(semUV),还用点的大小衡量注册转化率(regRate)。结论比较直观,注册转化率高的点,在右上方,且预测线显示,投放力度越大,流量越大,且注册转化率至少不变。
到这个结论有点振奋了,有没有?
还能不能再增加点信息?可以,我们将单位点击成本进一步放到散点图中。
案例四:气泡的颜色再衡量一个变量,升级为彩色气泡图
如图,点的大小是注册转化率,点的颜色是单位点击成本,从暖色调到冷色调,由低到高。转化率高且cpc低的点,在右上角。我们可以说,sem投放成本越高,sem流量越多,且转化率越高,更可喜的是cpc还更低。对于一个sem投放部门来说,没有比这更完美的结论了。
但是,散点图只是反映了相关关系,并不是因果关系。我们不能说,增加sem投放是注册转化率升高且cpc降低的原因。但是,有这么显著的相关关系,我们就有足够的理由去增加投放,然后再去观察数据。
数据分析再精确,如果缩手缩脚,是依然办不成事情的。
当然,投放策略分析是可以做得非常复杂的,我们这里只是为了介绍散点图而引入了这个场景,初步地做个分析。但在中小企业,我觉得做到这一步就可以了。(这几张图已经可以把老板搞晕了,然后给你一大笔预算!)
注释:
1.文中图表是使用R软件的gglot2包实现的,很遗憾不是excel。感兴趣的读者可以关注“川术”公众号并给我留言,留箱。我将无偿分享代码。
2.直接访问来源(directUV)是指直接在地址栏输入URL或者将主站URL添加收藏夹后,访问来到主页的流量。
3.自然搜索来源(organic)是指搜索引擎上,由非付费词搜索点击进入网站的流量。而semUV就是有付费搜索词进来的。
4.四分位数,指将一个数列排序后,处在排名第25%、50%、75%的位置的数。可以查查百分位数的概念,你会理解更透彻。
5.局部加权回归,有点难描述。如果你懂回归,就去谷歌一下,如果不懂回归就算了
分享到:
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
dcwang1233
2016-5-13 05:03:05
很有意思
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
Sam.Lee.xs
2021-6-10 08:33:28
学习学习,谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
哪种数据图表软件生成的图表比较漂亮的?
2006.01-2009.07逐月中国M0、M1、M2货币数量总量及增长率统计数据图表
求问大家做研究的时候去哪里找宏观经济类的数据图表?
对数据图表的讨论
求咸宁市2011数据图表
用数据图表读世界杯
图表是件花衣裳(一)——不要小看散点图
案例丨数据图表在手机端的可视化表达
龙周刊:庄家的骗术有哪些(1)
可视化数据图表制作应该注意那些要点
栏目导航
JMP论坛
投行专版
经管文库(原现金交易版)
金融实务版
行业分析报告
外文文献专区
热门文章
文本分析:从经管顶刊“加分项”到学术发表 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
CDA 数据分析师:线性回归实战指南 —— 从 ...
2025中国播客行业现状与发展趋势报告
2025年三季度中国消费者消费意愿调查报告
十五五规划建议思维导图
【详细整理,24重磅!】1990-2024上市公司市场 ...
“十五五”规划建议稿解读:乘势而上,因势 ...
奇瑞首夺J.D.Power-VDS自主冠军
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群