全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1673 0
2020-07-23
数据科学专家应具备哪些基本技能和知识领域?
数据科学是一个结合了多个相关学科的广阔领域。它们是编程,数学和统计,业务分析和机器学习。数据科学领域的专家是数据分析师,他们通过提取有用的信息以进行业务决策来处理大量数据。结果提供了许多问题的答案:例如,下一季度应购买多少单位商品,以及哪种药物成分将改善患者的健康状况。为了解决这些问题,专家开发了无需人工干预就能产生结果的算法。
您需要了解的内容
培训要求和专业技能水平取决于专家将在哪个公司工作。例如,在大型公司中,数据分析对于理解数学和统计数据很重要。鉴于,市场和媒体公司需要专家来开发推荐系统。
以下是成功的专家所需的技能和知识领域。
程式设计
当今,数据科学中最流行和通用的语言是Python。早期,最流行的语言是R,R仍用于数据分析,科学统计分析以及一些数据分析人员的社会学中。在其他语言中,Python可以被评为良好,因为您可以开发几乎任何库来执行各种改进的任务。基本的Python发行版很小,并且易于安装和升级。
每个库都有丰富的文档,因此很容易理解。围绕着最流行和最流行的社区组成了支持图书馆,为图书馆开发新模块和功能的社区。
分析
数据分析的基础是处理数据。包括那些可以“喂食”已开发算法的算法。围绕着大量数据,现代人类每天都以惊人的速度生成它们。这些数据必须能够收集,存储,采用分析或机器学习可接受的格式-理解,格式化并确定可以从这些数据中确切学习到什么。
数据分析与Python专用库的使用以及对数据分析的数学和统计基础的了解紧密相关。能够在其中找到模式并理解业务的目的和目标非常重要。
数理统计
由于现代图书馆包含大量现成的解决方案,因此人们可以在没有基础数学知识的情况下进行数据科学。借助这些库,无需分析数学细节即可分析数据并训练算法。但是,直到第一个真正复杂或非典型的任务。
专家需要了解的内容:
·线性代数:使用向量和矩阵数据表示的基础知识。
·数学分析:要优化模型和算法,请了解可以在哪里“扭曲”模型,以便使其更快更好地工作。
·概率论和统计学用于许多机器学习算法,数据分析和足够的a / b测试。它有助于评估您可以在多大程度上依赖可用数据,如何使用数据中的异常值,这可能会破坏信息的可靠性。
·使用NumPy和其他Python库进行计算和构建模型。对于数学和统计计算和转换,Python在各处得到广泛使用。这些工具的知识对于进行机器学习也是必要的。
机器学习和深度学习
神经网络训练是机器学习的子部分之一,而机器学习又将深度学习区分开来。一个复杂的术语系统与该地区发展了数十年之久有关,之后方法的新突破才使该地区真正流行起来。现在,当涉及到训练神经网络时,大多数情况下,它意味着深度学习方法。
尽管机器学习是数据科学的一部分,但它是一个巨大的独立领域。它几乎可以无限期地开发,并且每年都会出现新的方法。以前,深度学习是有条件地统一知识的领域,但今天是其子域; 计算机视觉,使用自然语言,强化学习,生成性竞争网络和其他方法在独立的专业领域中脱颖而出。这个方向正以惊人的速度快速增长,迫使专家不断保持其知识水平,以便与市场保持同步。
数据工程
数据具有分析,信息甚至物理意义上的结构。数据需要存储在某个地方,保持可访问性和稳定性,并组织架构。例如,纽约证券交易所在上一交易日每天产生1 TB的交易数据。
用成百上千兆兆字节测量的数据进行组织工作并不容易。要与数据工程师互动,需要使用一些方法,概念和工具。信息工程师参与组织数据的收集,存储和访问。
生产中的数据科学
最终,为了业务利益而应用数据科学需要所有知识和工具。这里有两个技巧很重要:
·能够准确确定解决特定问题所需的工具的能力:在哪里实现机器学习,在哪里构建数据库和实现SQL查询。
·杂货店对您的工作的展望:与同事沟通和建立联系,争辩您的观点以及管理工作和团队流程的能力。
要成为数据科学专家,您需要掌握各个领域的许多技能。未来的数据分析人员需要自我组织和决心来掌握这类知识。您将必须导航信息流,而不要按学习顺序迷路,找到最相关的方法和原理,最重要的是弄清楚为什么有些地方做错了,并找到合适的实践领域。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群