全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
3083 2
2015-10-28

“每天一个数据分析师”在第八期有幸采访到杨丽娟,她是山西人,毕业于东北财经大学,从事数据分析工作已有5年,目前在一家车联网公司任职。下面进入正题。


DA:您是如何入行的?


丽娟:我本科和研究生一直学的是统计学,咨询和调研行比较喜欢招统计专业的学生,所以最初我选择去了调研公司,岗位是研究员,数据分析是工作的一部分,还包括前期撰写项目方案和后期写完整调研报告,后来去了甲方公司,转做数据分析。


DA:您的工作经历,目前的工作职责(做哪块),工作中曾做过的数据分析实例,以及您的职业规划?


丽娟:现在主要职责是做经营情况、运营活动和用户行为分析,为运营推广活动提供数据支撑,还有和技术、研发的数据对接,毕竟做数据分析的基础是数据,只有清楚数据的来源和含义,保证数据的相对干净,才能使得数据分析的结果有价值和意义。


未来职业规划从大方向来说应该还会是数据分析,有可能的话向挖掘努力,做数据分析是件有意思的事情,每次做完哪怕一张表格都感觉很有成就感,像是完成了一件艺术品,如果有一个小的发现和突破更是能兴奋不已。


DA:能否给我们讲讲您在工作中遇到的印象深刻的困难及其背景成因?


丽娟:企业内的数据分析岗位(区别于专门提供数据产品的数据公司或咨询公司)都是要对某个业务决策提供支持的,不管传统行业还是互联网,分析的思路都是大同小异的,所以第一个重点也是难点是根据数据表现找原因,发现业务存在的问题。另外一个难点则是理论方法怎么有效应用到实际业务分析中。


DA:这个问题最终是如何解决的呢?能否向广大同行分享一下思路?


丽娟:对于第一个难点,这就涉及溯源的问题。比如某一天的主站搜索量增幅很大,就需要去找原因,往往一个指标的变化是受很多因素影响的,可能是前一天推了一个活动,也可能是有内部的测试,也可能是做了SEO优化,不能直接把这些列举出来就是找到了原因,某些看似是原因,但实际并没有什么影响。作为数据分析人员在对数据做出结论的时候不能只是主观判断可能是,必须要有依据,这时候就要分析到底哪个或哪几个是真正的影响因素,影响作用多大,才能为以后的策略提供依据和借鉴。


通常在这时候都会采用逐步深挖、逐层递进的因素分解方法,比如搜索量首先按照来源渠道分解为推广搜索、自然搜索、外部链接、直接访问,判断是整体增长还是个别渠道增长。如果是搜索带来的再进一步按引擎拆分为百度搜索、搜狗搜索、好搜等,之后可以继续按搜索词、入口页面分析,并在每一步计算出贡献率。就比如第一步计算出各个来源PV的增长对总的增长的影响程度,第二步计算某个搜索引擎对该来源的影响程度,以此类推,最终根据乘法和加法得出具体某个因素对总体PV增长的贡献率。当然这只是举了一个比较简单的例子,很多情况下某一个指标的变化甚至会牵涉到不同的业务关联,但无论怎样,我认为解决方法最终都归结为找来源(渠道)、定关系、明事件、做细分四个环节


对于第二个难点,我们在学校学习了很多分析方法、模型,但是很多时候实际数据并不符合模型的建模条件,比如最典型的是统计中的很多方法要求数据符合正态分布,但实际不是这样,不能简单机械地套用模型。所以在用方法和模型之前,首先确定数据的分布,然后选择合适的方法就很重要。


举一个例子,之前用回归分析做过一个关于销量的预测,其中因为有一个特殊事件导致出现强影响点,这种情况下残差不符合正态分布,进而导致回归估计有偏,并且模型的稳定性差。以前会将强影响点去掉来作数据拟合,即人为忽略强影响点的影响作用,但是这个强影响点是因为一个重要的事件导致的,如果忽略掉,拟合的模型不能真实反映实际数据的情况,那也就没有实际意义。于是尝试在回归模型中引入分类虚拟变量,也就是将强影响点离散处理,作为一个事件变量,通过这个事件的不同取值下拟合模型的回归系数的差异性来体现事件的影响,也包含在销售量的预测值中。当然这个方法还有待完善和改进,也欢迎大家提出修正建议。


DA:请问您对希望从事数据分析行业的职场人有哪些建议?


丽娟:数据分析工作是一个需要综合行业知识和数据技能的岗位,要想职业发展道路能走长远,需要对某一个行业有深入的认识和理解,行业决定发展的深度,数据技能是实现的手段和方式,因此首先是尽可能选择自己较为感兴趣的行业,其次是丰富各种技能。


另外做数据分析解决问题的思路很重要,就是面对一个问题,不是先去想用什么公式、算法,而是先要有整体的框架思维,理清逻辑关系和处理步骤,这样更有助于达成最终的分析目标。


DA:请问您如何看待数据分析师行业的就业前景及未来发展?


丽娟:数据分析师现在还属于新兴职业。以前在传统行业一些大的公司也会设置这样的岗位,但是相对较少,职责较为单一,主要是做一些统计报表(日报、月报、季报)之类。这几年随着互联网的发展和大数据变火,很多公司对数据开始重视,市场上的岗位逐渐增多,因此整体看来会有一个需求的爆发期。


对于数据分析师来说,需求和供给都在增加,未来要保持自己的核心竞争力关键在于培养一种特有的思维模式,形成独特的对数据的深度解读和敏锐洞察、分析能力。因为很多技术层面的东西都会由机器学习、一些大的软件供应商和技术大牛解决。比如R有很多人贡献的包,直接加载就可以完成一些模型的建立和拟合,不需要也没必要非要自己去写个算法、写个包出来,尤其是像我这种经济统计出身,在编程、算法方面没有突出的优势的人。因此建立竞争力需要的是快速解读能力,不是告诉看数据的人这个数据是什么,而是会怎么样,即能快速解读出这个数据反映出来的业务的逻辑和存在的问题,这是为决策提供支撑的关键,也是计算机无法取代的地方。


DA:请您推荐一些平时在网络上学习专业知识的平台吧。


丽娟:平时学习的时间分成碎片时间和完整时间。碎片的时间会在网上看些东西,比如去经管之家、统计之都、新浪微博等。微博信息量很大,一般分成两大类来看——技术类和行业类。技术类又按照和日常工作关联度分为两类——有关联但是关联不高的。关联度不高的作为知识储备,就是大概了解一下,关联度高的重点看看。行业类是为了帮助自己及时了解行业资讯和动向。这里推荐沈浩老师的微博,无论在调查研究领域,还是数据挖掘、可视化方面都有很多有价值的东西值得学习和借鉴。


整块的时间会去看书,前一段时间看了《数据挖掘与数据化运营实战-思路、方法、技巧与应用》,卢辉写的,对于做数据化运营分析的人有参考价值,既有对分析方法的介绍,也有对分析思路、思维模式的探讨。



DA:平时工作之余都做些什么呢?有什么特长爱好呢?


丽娟:空闲时间比较宅,喜欢看纸质书,可以随手附上当时的读书心得,日后翻看会有不同的感受。还比较喜欢看电视剧。周末也会和朋友出去逛街,适当消费也是种乐趣。


才艺好像没有什么特别的,不知道善于观察人算不算,有时候坐地铁或者公交的时候闲着没事喜欢根据某人的穿着、气质等判断可能从事什么工作,衣着品味如何。如果是在社交场合,通过一些沟通大概能判断这个人的性格和从事的工作类型。


DA:最后,方便留下您的联系方式以便交流吗?(建议大家直接在后台提问,我们会统一整理并反馈给被访者,这样彼此都能节约时间提高效率。)


丽娟:qq:718107082

           Email:yanglijuancv@163.com


DA:谢谢您。今天的采访到此结束,我们再会。


后记:这是“每天一个数据分析师”的第八期采访,非常感谢受访的各位老师以及订阅读者向我们提出的各种建议,我们期待更多的声音!我们计划每天采访一个数据分析师(覆盖各行各业),听TA在从业路上的故事,讲TA在工作中遇到的种种困难以及采取的解决方案。欢迎大家踊跃推荐或者自荐。联系我们请直接在微信留言或发邮件到:adaaday@pinggu.org


简介:我们是经管之家(原人大经济论坛)CDA数据分析师培训旗下的公众账号“每天一个数据分析师“。旨在通过采访数据分析师来讲述数据分析在各行业应用情况或其他重要问题,藉此展示分析师自身水平和风采,打造个人品牌,助力升职加薪和求职。同时也让社会公众了解数据分析师这个群体。每一篇头条专访将会给您带来大量关注,这是为您精心打造的炫丽舞台,请善用这个共同的平台。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-19 11:23:13
培养一种特有的思维模式,形成独特的对数据的深度解读和敏锐洞察、分析能力
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-30 10:06:56
好榜样,学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群