每个数据科学初学者提出的10个问题
数据科学初学者往往会问一些关于他们的职业和学习道路的常见问题
这里有10个此类问题,提供全面的答案,可帮助所有数据科学初学者
介绍
开始数据科学事业很有吸引力,但这是一个充满障碍的旅程。您会注意到几个关键问题不断出现–从哪里开始?学习什么以及如何学习?如何找到有关数据科学的正确资源?
如果您曾经问??过这些问题或正在努力寻找答案,那么您并不孤单!
数据科学是一个相对较新的领域,仍处于起步阶段(是的,甚至在2020年)。很难解开它提供的每个难题。数据科学初学者面临的主要挑战是关于数据科学的知识是分散的,每种不同的资源都采用不同的方法。在所有这些混乱之中,您如何才能成为一名成功的数据科学家?
数据科学初学者问题
在本文中,我将讨论数据科学爱好者和初学者提出的10个最常见的问题。这些将帮助您弄清数据科学事业的不同方面,包括简历,面试过程和其他最佳实践。
此外,这是一个数据科学路线图,定义了数据科学历程中的里程碑。使用此路线图跟踪您的数据科学之旅,了解您的立场以及下一步应该做什么。单击此处下载数据科学路线图。
现在,本文适用于那些试图在数据科学行业中摸索自己的人。参加Analytics Vidhya的Blackbelt +计划的人员不会遇到此类问题,因为他们一直与导师保持联系。您还可以通过BlackBelt +程序从零开始变英雄!
1.数据科学爱好者在采访中最常犯的错误是什么?
让我们一一讨论数据科学爱好者最常见的错误:
仅准备理论主题而不应用它们
假设您正处于数据科学面试的中间,面试官问您-什么是随机森林,它如何工作?作为一个简单而标准的问题,您可以轻松回答该问题。然后跟进的人来了–您将如何在业务环境中提高模型的性能?
现在,除非您以前使用随机森林解决了数据科学问题并对其超参数进行了调整,否则您将无法给出正确的答案,而这可能会导致面试官的怀疑。
假设您在ML竞赛中看到的就是真实工作的样子
参加
机器学习竞赛,没有比为数据科学角色做准备更好的了。这是不可否认的。问题在于它并不能使您成为行业就绪的专业人员。通常,面试包括个案研究,以测试您的解决问题的能力和领域知识,而这些通常是通过经验获得的。
使用过多的数据科学术语
您的履历表是您完成的成就和完成方式的简介,而不是简单记下的事情清单。当招聘人员查看您的简历时,他/她想了解您的背景以及您以整洁和概括的方式完成的所有工作。如果页面的一半充满了模糊的数据科学术语,如线性回归,XGBoost,LightGBM,而没有任何解释,则您的履历可能无法清除筛选过程。
无法使用交流技巧
沟通技巧是数据科学家绝对必须拥有的被低估和谈论最少的方面之一。您可以学习所有最新技术,掌握多种工具并制作最佳图表,但是如果您无法向客户解释您的分析,您将以数据科学家的身份失败。这就是面试官将在面试过程中进行的测试。
2.我来自非技术背景,为什么我应该学习软件工程?
数据科学初学者问题-软件_工程_机器_学习
老实说,这是最常被问到的问题之一,我希望您读完这篇文章后能消除您的疑虑。
每个数据科学项目的最终目标是在生产中部署该项目。因此,无论您的模型多么精确,如果没有最后一步,它仍然是不完整的,因为我们将在本文中进一步讨论它。
要编写不会在生产阶段造成严重破坏的高质量代码,有必要了解一些软件工程主题的基础知识,例如–软件开发项目的基本生命周期,数据类型,编译器,时空复杂性等
从长远来看,编写高效,整洁的代码将为您提供帮助,并帮助您与团队成员合作。同样,您无需成为软件工程师,但了解基本知识将对您有所帮助。??
3.我需要擅长编程才能成功地成为数据科学家吗?
我将在这里重申–您不必在编程时“精通”,但您必须在编程中“精通”。让我问你一个问题–您首选的数据科学语言选择是什么?Python,R,SAS还是Julia?让我们在这里以Python为例。
数据科学初学者问题-编程
要在如此广阔的空间中成为足够好的数据科学专业人员,您必须对基本的Python及其操作,其基本的机器学习库(例如Pandas,NumPy,Scikit Learn)进行良好的实践。您应该能够流畅地编写自定义函数,生成器等。即使您目前不知道如何优化代码,也可以。您应该能够将周全的操作转换为代码形式。
您无需掌握所有语言,而是选择一种语言并随时间掌握。如果您认为希望全面了解数据科学语言和工具,可以访问BlackBelt +,那里的机器学习专家可以教您Excel,SQL,Python及其库,从简单的Pandas到高级Keras!
想开始为您的数据科学职业编程吗?这里有一些资源–
数据科学用Python
熊猫数据科学
完整的Python教程,学习数据科学
4.什么是模型部署,为什么我应该了解它?
部署
一旦完成了完整的数据科学项目,目标用户/利益相关者就该收获机器学习模型的预测能力的好处了。简而言之,这就是模型部署。从业务的角度来看,这是最重要的步骤之一,但也是最少的步骤。
让我们在这里举个例子。一家保险公司启动了一个数据科学项目,该项目使用事故中的车辆图像来评估损坏程度。数据科学团队昼夜不停地开发具有接近完美F1分数的模型。经过几个月的努力,他们已经准备好了模型,并且利益相关者喜欢它的表现,但是之后又会怎样呢?
请记住,在这种情况下,最终用户是保险代理人,并且该模型需要由不是数据科学家的多个人同时使用。因此,他们不会在GPU上运行Jupyter或Colab笔记本。这是您需要模型部署的完整过程的地方。
该任务通常由机器学习工程师完成,但是根据您所从事的组织的不同而不同。即使这不是您公司的工作要求,了解模型部署的基本知识以及为什么这样做也是非常重要的。
5.数据科学领域的职业机会是什么?
如果数据科学没有提供诱人的机会,它就不会被称为“ 21世纪最勤奋的工作”。这是一个价值380亿美元的市场,预计到2025年将达到1400亿美元。在这十年里成为一名数据科学家真的令人兴奋。
在基于数据的角色世界中有大量的工作机会。您可以成为业务分析师,数据分析师,甚至可以使用机器学习工程师或
深度学习工程师的高级角色。如果您更喜欢数据科学,那么让我们看看典型的职业道路是如何绘制的。
数据科学家的优势在于编码,数学和研究能力,需要不断学习。一旦您成为数据科学家,您就可以期望遵循这条一般路径并发展到这一领域,这将使您成为数据科学的领导者。一旦您掌握了行业知识和经验,就可以期望深入研究产品角色,甚至最终成为企业家。令人兴奋,不是吗?您可以参考以下资源,为数据科学的角色铺平道路-
开始您的第一个数据科学项目?这是您必须绝对知道的10件事
开始您的第一个数据科学项目?这是您必须绝对知道的10件事
6.应在“数据科学工作简历”中列出哪些技能?
您可以在履历表中提及无数种技能,但问题是–您应该限制10种未经验证的技能还是3-4种强大的动手技能?答案是,您可能已经猜到了,后者。面试官会期望您在所提到的每一项技能上都很好。
让我们一一讨论一些要点:
根据工作角色优先安排技能
面试官对雇用任何人员有非常具体的要求。您必须根据职位描述塑造简历。例如,职位描述要求候选人具有强大的Python和机器学习据点。而您拥有Python,机器学习和深度学习的据点。为了炫耀,您包括与深度学习相关的所有项目,而错过了机器学习项目和技能。这可能会招募招聘人员,并且您将失去获得令人垂涎的工作的机会。
提及数据科学项目
正如我在上述问题中提到的那样,实践知识比理论知识更重要,而数据科学项目是展示技能的一种清晰方法。尝试提及将展示您所包括的每种技能的项目。
不要忘记您的GitHub个人资料
如今,如果您想从事数据科学工作,则必须有GitHub个人资料,除非所需技能仅仅是Excel或SQL。Github个人资料会灌输信心,信任和灵活性,以签出您在简历中提到的任何项目。这是赢得招聘人员心脏的肯定方法。
总体履历表
除非您的能力多么出色,除非简历清楚地说明了您或您的技能,否则您将不会进入下一阶段。因此,请准确确定简历的格式,字体和结构。您可以查看以下由Google发布的视频。它具有一些令人惊叹的指导方针和建议,可帮助您构建出色的简历。
下次数据科学面试时应重点关注的6个关键点
开始您的第一个数据科学项目?这是您必须绝对知道的10件事
7.我是否需要了解统计信息才能发挥数据科学的作用?
据说:
“统计是数据科学的语法”
因此,对这个问题做一个简短的回答–是的,您需要了解统计信息才能从事数据科学工作。但是不要害怕。您无需修读统计学的硕士课程。您必须有几个主题/概念,您必须先执行命令,然后再进行操作–
描述性统计(平均值,中位数,众数,方差,标准差)
推论统计(假设检验,z检验,t检验,显着性水平,p值)
统计分析(线性回归,预测,逻辑回归)
这是您必须精通的基本主题列表,如果您找到合适的资源,这不会花费很多时间,因此在这里我要提到一些资源,否则您可以查看Blackbelt,其中涵盖了有关统计和数据科学的所有内容全面地–
数据科学统计:什么是正态分布
您的统计假设假设测试指南
8.我应该参加黑客马拉松吗?那对我找工作有帮助吗?
数据科学竞赛提供了一个绝佳的机会和平台来展示您在短时间内开发的技能。它可以帮助您了解机器学习项目的领域,技术和流程,并提供很好的方向感。
大多数招聘人员都对过去的黑客马拉松表现给予了极大的关注。因此,如果您现在还没有开始参加的话。如果您担心提交黑客马拉松,请不要担心,有时它可能会令人不知所措。您可以查看HackLive –一个受指导的社区hackathon,通过它您可以掌握参与hackathon的技巧。
受启发参加黑客马拉松吗?以下是一些文章,可帮助您开始自己的旅程–
Ace数据科学和机器学习黑客马拉松的12个强大技巧
我如何成为Scratch的数据科学竞赛大师
9.数据科学认证有什么好处?
数据科学认证肯定会带来一些优势,它反映出您对数据科学领域的兴趣,但有一个警告-由于数据科学的蓬勃发展,这些课程的大量采用使它们成为通用课程或一般。那么在这种情况下您能做什么?
如果您要学习多个MOOC网站提供的免费认证课程,那肯定会反映出您对该领域的兴趣,但并不能帮助您脱颖而出。要在人群中脱颖而出,您将需要学习一门课程,为您提供行业知名度和高质量的项目。一种衡量优秀人才的标准认证。
BlackBelt +是一门这样的课程,它将为您提供成为数据科学行业中非常有价值的专业人员所需的一切。这不仅与认证有关,还与它附带的质量和指导有关。
总之,如果您要进行认证,那么请明智地做出决定。获得行业重视的认证。
10.奖励问题–我如何成为行业就绪的数据科学专业人员?
这也许是每个数据科学专业人士最常问的问题。但是首先,什么是行业就绪专业人员?这是具有硬技能和软技能的人,无需组织的专门培训即可胜任。这些专业人员从第一天起就产生影响。
与成千上万的数据科学专业人士交谈后,Analytics Vidhya提出了BlackBelt +课程,其中包括成为行业相关专业人员所需的一切。
Blackbelt +的一大优势在于,不仅为您提供14多种高质量的课程和25多种现实生活中的项目,还为您提供了一位导师,从第一天起您就会得到指导,并根据您的需求。
题库