全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
926 0
2016-12-11
对待数据,你为什么不如数据分析老司机?

先来一个小笑话:科学家卸掉了螃蟹的左腿,并对它喊道“走”,螃蟹迅速爬走了。科学家又卸掉了螃蟹的右腿,仍对它喊道“走”,螃蟹没有爬走。因此聪明的科学家得出结论,螃蟹的耳朵是长在右腿上的。


再来看一个简单的例子:


经济危机时,根据统计,某国家50%人的财富增长了10%,另一半人则减少了50%。

QQ截图20161211193037.png

新手是这样解读的:整个国家的财富减少了40%。

  

而老司机这样问:增长的人财富基数是多少,减少的人基数又是多少?

  

没错,如果增长的那一半人原有财富是100,而减少的人原有财富是2,那么整体来看,财富不仅没有减少,反而增加了8%。

  

别被数据给骗了。

  

对待数据,如果你还不是老司机,那你应该怎么做?怎样才能做好大数据分析? 

 

1、明确分析数据的目的

咱们要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。

2、到哪里获取数据

当你制定了目标,那么现在会很明确要找哪些数据。这些数据在从内部资源获取不到的情况下,可以通过下面的几种方法:1.花钱购买(有专门的机构出售数据,如果你并不需要十分精细的或大篇幅的,或许可以看第二种方法)。2.网站下载(统计局官网、行业网站如房地产交易网等、大海洋数据超市)。3.自行获取(网页爬虫、网页采集器)。

3、数据处理

无论你通过什么方式获取数据,最终都要经过符合你需求的处理,删除不相干的干扰项,但也别忽视相关项。

  

例子:某二手车交易网的用户数据调查发现,有13%的用户月交易数量评价达到9次,且多为年龄在40-50岁之间的男性。

  

因此你得出结论,中年男性最爱频繁换车。但实际上,这13%的用户很可能是二手车行的老板,相信再喜欢换车的人也不能一个月更换9辆车。

  

所以用户的工作性质不可忽视,存在相关性的因素更不能轻易刨除。

4、记得你的立场

数据的因果关系和相关性非常迷人,导致许多数据分析者做着做着就忘记了自己的初衷和立场。你不需要挖出全部的数据相关性,只需要记得你在做以什么研究为目的的数据分析。

例子:你在做公司的业绩分析,需要从数据的角度提出员工业绩的影响因素,在挖掘的过程中,你进而发现公司盈利逐年变低是支出的不断超额,你的老板会对你说声谢谢,不过他需要你操心的只是业绩。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群