全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
961 0
2020-11-24
现代数据科学,人工智能,大数据和机器学习的要素
敢肯定,每个关注技术行业新闻的人都知道“大数据”和“人工智能”。尽管两个术语都没有行业一致的定义,但大多数人倾向于同意他们最近都在发挥越来越重要的作用,并且我们需要在我们的个人和职业生活中更好地了解和利用它们。但是,如果我们暂时不看市场炒作,谈论使用这些技术解决实际业务问题的人员,他们是谁,他们拥有哪些技能以及他们实际上在做什么,那不是很有趣吗?如果您这样认为,请继续阅读,我们将与您分享LinkedIn上数据科学和分析背后的一些实际方面。
LinkedIn的Google Analytics(分析)团队的使命是“通过严格使用数据来促进理解并做出有影响力的决策”,并且一直在快速增长,并且没有放缓的迹象(目前在全球拥有20多个团队)。我们一直在寻找顶尖人才,与我们一起建立LinkedIn的经济图表并对其进行分析,以发现能为我们的会员和客户创造经济机会的见解。在寻找新人才加入我们的团队时,我们通常会在以下领域采访候选人。     
数据整理/合并/处理
尽管它听起来不像“数据科学”那么酷,而且人们可能用许多不同的名称来称呼它(因此本节标题中使用多个正斜杠),但这是我们认为数据科学家必须具备的核心技能之一有。它包含一系列您必须做的事情,以了解您的数据并准备好数据以进行更深入的分析,数据挖掘,机器学习等。在现实世界中,与大多数时候在学校所教的内容不同,您几乎永远不会获得“完美”的数据,尤其是当您使用每天都在变化的尖端技术时。这意味着您必须充分了解数据的业务背景,才能解释,清理数据并将其转换为可使用的格式。听起来很容易,但实际上并非如此。通常,您可以很容易地在整个项目上花费50%以上的时间在此步骤上(假设您精通该技术,并且实际上在第一时间就做对了)。LinkedIn作为一项快速发展的业务,其产品快速变化以满足我们成员和客户的专业需求,在应对这一挑战时也是如此。通常,我们要求候选人针对特定数据集使用诸如SQL,R或Python之类的编程语言执行一系列数据操作,包括聚合,分布,排序等,以证明其在该领域的功能。目标不是测试确切的语法,而是测试正确的方法和思考过程,以及他们根据业务环境做出合理判断的能力。LinkedIn作为一项快速发展的业务,其产品快速变化以满足我们成员和客户的专业需求,在应对这一挑战时也是如此。通常,我们要求候选人针对特定数据集使用诸如SQL,R或Python之类的编程语言执行一系列数据操作,包括聚合,分布,排序等,以证明其在该领域的功能。目标不是测试确切的语法,而是测试正确的方法和思考过程,以及他们根据业务环境做出合理判断的能力。LinkedIn作为一项快速发展的业务,其产品快速变化以满足我们成员和客户的专业需求,在应对这一挑战时也是如此。通常,我们要求候选人针对特定数据集使用诸如SQL,R或Python之类的编程语言执行一系列数据操作,包括聚合,分布,排序等,以证明其在该领域的功能。目标不是测试确切的语法,而是测试正确的方法和思考过程,以及他们根据业务环境做出合理判断的能力。使用特定语言的编程语言(例如SQL,R或Python)进行分发,排序等,以展示其在该领域的功能。目标不是测试确切的语法,而是测试正确的方法和思考过程,以及他们根据业务环境做出合理判断的能力。使用特定语言的编程语言(例如SQL,R或Python)进行分发,排序等,以展示其在该领域的功能。目标不是测试确切的语法,而是测试正确的方法和思考过程,以及他们根据业务环境做出合理判断的能力。
实验设计和A / B测试
统计知识是数据科学家必不可少的。尤其是,了解如何针对不同的业务用例设计实验并进行A / B测试是必不可少的技能。我们希望每个团队成员都有能力了解基本统计信息概念(例如,假设检验,均值/中位数,方差,概率分布,样本量计算,功效计算等),设计和分析实验,并将其应用于业务设置。期望不仅是他们需要对这些问题有理论知识,而且还必须知道他们如何主动地以科学的方式来指导产品开发。其中包括诸如我们如何设计成功指标,如何制定实验计划,以及如何提供及时的见解来指导将测试从小规模试点扩展到100%的成员基础,这通常还需要进行迭代以使产品功能正确以实现成员满意度和期望的业务成果。对于初级数据科学家,我们将重点更多地放在关键统计概念的基本理解上,以及候选人将这些概念应用于实际用例时所表现出的商业意义。对于高级候选人,我们希望他们具有相关的行业经验和深入的统计知识,不仅可以回答问题,还可以寻求能够创造最佳水平的会员体验和业务影响的解决方案。对于初级数据科学家而言,我们将更多地集中于对关键统计概念的基本理解,以及将这些概念应用于实际用例时候选人所展现的商业意义。对于高级候选人,我们希望他们具有相关的行业经验和深入的统计知识,不仅可以回答问题,还可以寻求能够创造最佳水平的会员体验和业务影响的解决方案。对于初级数据科学家,我们将重点更多地放在关键统计概念的基本理解上,以及候选人将这些概念应用于实际用例时所表现出的商业意义。对于高级候选人,我们希望他们具有相关的行业经验和深入的统计知识,不仅可以回答问题,还可以寻求能够创造最佳水平的会员体验和业务影响的解决方案。   
统计建模/机器学习
统计建模或机器学习技能对于数据科学家来说是必不可少的。我们正在考虑的方面是候选人将业务问题形式化为机器学习问题,选择适当的建模算法并按照正确的培训,测试和验证过程构建模型的能力。通常,Analytics团队的数据科学家不会将大部分时间都花在建模工作上。但是,我们发现,了解通用机器学习算法并知道如何将其应用于特定的业务环境是数据科学家职业成功的关键。如果没有对此领域的正确理解,很容易导致对数据的错误解释,从而可能导致不完善的决策或较差的结果。关于“相关性与因果关系”和“错误的数据比没有数据更糟糕”的争论不断,都是很好的例子。真正重要的是如何针对要解决的业务问题类型选择正确的机器学习算法(了解每种算法的优缺点,例如逻辑回归,线性回归,决策树,深度学习等)。对于。
软技能
除了我们在面试中检查的所有技术技能(或“硬技能”)外,我们还仔细评估候选人的沟通,项目管理和影响力技能,所有这些都被视为同等重要。成为数据科学家的技巧包括如何根据从数据中发现的内容有效地影响他人,而这往往是推动数据驱动的决策文化的最难的部分。我们提出的问题类型包括:您如何以简洁明了的方式总结您的发现;如果基于分析结果不能使涉众不满意,您将如何处理情况;您如何回应有关算法/的问题非技术人员提供的方法论,以及如何管理未按计划进行的项目并将其扭转?最终,目标是利用分析产生的见解,并有效影响关键决策,从而推动业务影响。为了使数据科学家成功,“硬技能”和“软技能”需要一起工作。
案例研究和问题解决
成为数据科学家并非易事,尤其是从某种意义上来说,您必须非常了解业务用例才能以数据驱动的方式解决问题。这需要良好的业务领域知识,批判性的分析思维,熟悉进行根本原因分析,以及有效地传达结果以影响业务决策的能力。我们在这里要评估的能力包括使用正确的分析方法和合理的数据直觉来解决业务案例的能力,以及基于数据洞察力提出相关且可行的建议的能力。案例研究可以来自产品,市场营销或销售等业务领域,这些领域都基于您每天在工作中会遇到的情况。我们将其作为通配符模块,使求职者可以选择对自己更感兴趣或更有经验的业务领域,以便他们可以充分展示自己的业务意识。这也有助于我们在Google Analytics(分析)中确定可以分配候选人的最佳子团队。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群