数据分析技术之外的那些事
1. 不要隐藏真相——要反应客观事实
做数据分析,并不仅仅是分析,还有一部分责任是纠错,数据只是反映客观事实,不会讨好任何人,因为源头出现问题而导致你的分析结果出错,第一个挨骂的肯定是你,但是你不能因为害怕而隐藏这个事实,一定要揪出错误来源。
2. 不要装逼——用合适的工具解决问题
搞数据分析,技术上有很多解决方案,无论是Oracle、MySQL这种传统的RDBMS,还是Mongodb、Redis以及我们常见的HBase、Hive技术都可以用来做数据分析,不要一味的迷信技术实现,明明只有一个G的数据,为何要用HBase存储?搞数据分析最忌讳的就是用错工具——高射炮打蚊子累死你。
3. 永远不要说你的数据足够多了——你的数据够不够支撑你的分析?
大多数公司,如果仅仅是为了满足业务,实际产生的数据并不多,你需要自己去挖掘——我这里所说的挖掘不是技术上的挖掘,而是业务上的挖掘,通过被人忽视的细节得到对你业务有用的数据。
4. 永远不要说你的数据分析结果是精准的——数据分析就是算命
其实说白了,很多所谓的数据分析最终要达到的目的就是预测未来,预测股票、预测期货、预测生男生女、预测生老病死……但是真的能准确吗?很多值得去分析的数据,想要预测未来都几乎是不可能的,你能做的就是尽可能的提高准确率——如果你的准确率超过了行业内最有经验的人,就已经很流弊了。
5. 不要局限在自己的行业——多出去看看
生活是最好的老师,期货是现货的晴雨表,多出去看看,多想想关联,你能发现令人惊奇的关联性——哪怕是自己YY的,例如排名第一科比的那个例子,你找到了线性关系,剩下的就是琢磨合理性。