从零开始——成为数据分析师的九个步骤
1、 温习你的数学和统计学技能 。一个合格的数据科学家必须能够理解数据在告诉你什么,并通过从数据中获得的信息进行下一步的工作。你必须有扎实的基本线性代数,对算法和统计技能的理解。在某些地方上可能需要更高级的数学,但这是一个起步的好地方:)。
2、 理解机器学习的概念 。机器学习是与大数据有千丝万缕联系的新兴流行词。机器学习使用人工智能算法将数据转化为价值,且无需显式编程来进行自动学习。
3、 学习编程 。数据科学家必须知道如何操作代码以便告诉计算机如何分析数据。从一个开放源码的语言,如Python,开始起步是个不错的选择。
4、 了解数据库,数据仓库和分布式存储 。数据存储在数据库、数据仓库或整个分布式网络中,这些数据存储库建立方式决定了你如何访问,使用,并分析数据。如果你在构建数据存储之前不进行整体的考虑将会对你之后的工作带来深远的影响。
5、 学习数据规整和数据清洗技术 。数据规整是将原始数据转换成另一种格式以便更容易获取和分析的过程。数据清理有助于消除重复和“噪声”数据。两者都是数据科学家工具箱中的必备工具与技能。
6、 了解良好的数据可视化和数据展现的基础知识 。你不必成为一个平面设计师,但你需要精通如何创建一个门外汉,如你的经理或CEO,可以理解的数据报告。
7、 给你的工具箱添加更多的工具 。一旦你掌握了上面所说的那些技能,就是时候扩展你的数据科学工具箱了,如Hadoop、R、Spark编程。这些工具的知识和使用经验将会使你超过大部分想从事数据科学这方面工作的人。
8、 实践 。在你有一份该领域的工作之前,你如何实践练习数据科学?你可以使用开源数据进行你自己的个人项目,参加数据科学竞赛,通过网络和数据科学家协同工作,加 入一个训练营,作志愿者或实习生。最好的数据科学家在该领域应有当有足够的经验和直觉,并能够将他们的工作展示给招聘人员。
9、 成为社区的一部分 。关注行业的思想领袖,阅读行业博客和网站,参与其中,发出提问,并及时了解当前该领域的新闻和理论。
听起来是不是很多?好吧,确实挺多。数据科学不是适合每个人的,对于对其感兴趣并醉心于此的人来说,它可以是令人难以置信的奖励与回报。