全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
964 0
2020-12-11
面向初学者的数据科学入门
“数据科学家:21世纪最性感的工作”。
“到2025年,数据科学将成为1780亿美元的市场。”
“公司正在对数据科学进行大量投资。”
完成工程并开始工作后,我在网上不断受到这些言论的轰炸。我很困惑,就像佛陀想知道生活的真相一样,我也想澄清我的疑惑。为了寻找答案,我搜索了互联网,与这个域内外的许多人取得了联系。
在本文中,我整理了如何决定开始进入数据科学之旅。我们将讨论如何建立您的数字资料以及如何学习和保留数据科学概念。您是否对开始使用数据科学感到困惑?别担心,我会与您分享我的提示和技巧,这些技巧和窍门将澄清您的所有疑问。
数据科学是真的还是新瓶中的陈年葡萄酒?
数据科学是将领域专业知识,编程技能以及数学和统计知识相结合以从数据中提取有意义的见解的研究领域。数据科学从业人员将机器学习算法应用于数字,文本,图像,视频,音频等,以产生人工智能(AI)系统来执行通常需要人类智能的任务。反过来,这些系统会产生洞察力,分析师和商业用户可以将其转化为有形的商业价值。
第2模因
数据科学始终存在于我们之间。Excel,SQL,统计是数据科学的早期工具。这不会使该字段过时。数据科学将始终为我们提供新的和更新的魔术技巧。之前,我们曾经将数据输入到excel工作表中,然后绘制图表,如今自动存储数据并使用高级可视化工具自动绘制图表。随着技术的进步,数据科学为我们提供了许多流行语,例如机器学习,深度学习,AIOps等,并且它将继续如此。
没有什么比所有尺寸都适合
数据科学初学者-大小
老实说,没有确定的道路,也不应有明确的道路。数据科学的真正实质是来自不同背景和技术的人们一起工作。无论我经历了什么旅程,我都可以给您提供课程名称,并告诉您完成此类课程并进行此类项目,但这会给您带来负担。您将参加完成课程和项目的竞赛,并最终精疲力尽。我是一名电子工程师,他的最后一个项目是使用Raspberry Pi的面部识别智能门,他的兴趣使他学习了机器学习和深度学习。我也没有遵循特定的道路,我总是按照自己喜欢的方式去做,并让我彻夜难眠。
学习数据科学:是或否?
数据科学初学者-是或否
你们中许多人可能会认为非CS / IT人员是否可以学习数据科学。答案是肯定的。非CS / IT人士可以学习数据科学,这不是CS / IT人士学习数据科学的强迫。
由于社会压力,人们无需启动DS,ML或AI。如果您没有为AI愤怒做充分的准备,您可能会感到被排除在外。如果您擅长做事并且热爱当前的工作,那么继续做自己的工作,并通过阅读新闻和博客来保持最新状态,那真是太棒了。
就像需要生物多样性来平衡生态系统一样,繁荣的社区也需要技术多样性。我们将始终需要机械工程师,电气工程师,艺术家,Web开发人员,App开发人员,内容创建者,医生,电影制作人,CA和运动员等。
您应该深入研究数据科学吗?
数据科学初学者-深潜
在数据科学中,每个人都有所需要的东西。因此,别担心,开始用它训练您的大脑模型。输入的功能是您当前的领域,编程兴趣,好奇心,热情,激情和努力。
因此,让我们研究与数据科学相关的一些领域,人们可以追求这些领域:
数据可视化:如果您富有创造力并且喜欢统计数据,则可以学习数据可视化工具并成为Data Viz工程师。
数据工程和数据仓库:它处理数据的存储和查询以供将来分析。维护数据与进行预测一样重要。好的预测模型需要高质量的数据。
云和分布式计算:如果您是IT网络方面的专家,那么请熟悉数据科学项目的生命周期,然后可以设计和部署数据科学模型以方便访问。
商业智能和策略:如果您是领域专家,那么您就是整个数据科学项目的骨干。BI战略家负责管理仪表板,向利益相关者报告,测试和验证模型以及记录文档。
物联网开发人员:如果您喜欢硬件并且喜欢构建电路和控制器,那么您可以扮演使用传感器收集数据并准备进行实时分析或存储的角色。
计算机视觉:如果您喜欢图像处理,那么您可以应用深度学习概念,并致力于自动化过程和建立对象检测模型。
ML工程师:机器学习工程师将数据输入到数据科学家定义的模型中。他们还负责采用理论数据科学模型,并帮助将其扩展到可以处理TB级实时数据的生产级模型。
NLP工程师:NLP工程师的职责包括使用NLP技术将自然语言数据转换为有用的功能,以提供分类算法。
将来,将会有更多新的职位简介出现,唯一使您准备就绪的是持续学习。
那我对机器学习的指导是什么
我参加了一些自定进度的课程。我并不局限于课程提供的视频和作业,而是经过一段时间阅读习惯名称并开始从研究论文,互联网搜索,书籍和其他资源中学习。您也可以选择适合您口袋的任何路线。 查看内容的交付方式以及提供的其他服务。 我将与您分享我的准备工作路线图。我不会拘泥于严格的时间表,您也可以按照自己的节奏进行操作。
模因
数理统计
学习统计基础知识,并熟悉学校和大学数学。
导数和函数最小化
向量和矩阵
概率分布
随机变量
正态分布
Z分数
假设检验
Z检验和T检验
卡方检验
方差分析
F统计
以上主题仅是基础知识就足够了。
基本程式设计
您可以选择任何一种语言。我选择了Python。一些基本概念要知道:
资料类型
条件
循环
职能
面向对象编程
异常处理
不用担心,一开始对这些概念不满意。经过充分的练习,您将充满信心。
机器学习
了解不同的算法如何工作以及如何实现它:
线性回归
逻辑回归
决策树
随机森林
合奏,套袋,助推
XGBoost
朴素贝叶斯
知识网络
K均值聚类
层次聚类
数据库扫描
主成分分析
支持向量机
时间序列和异常检测
对于经验丰富的专业人员,可以从高级excel以及PowerBI和Tableau等其他数据可视化工具入手。您可以获得许多平台,无需进行编码即可执行ML预测。
如果您是新手,请开始学习编程,并完成有关ML的一些课程。做很多实验,继续努力。 清新的动机:“如果ML是您的激情,那就像蝙蝠侠:白天做办公室,晚上跟着激情。
如果您在大学里参加会议,讲习班,技术盛会,完整课程参加黑客马拉松,与尽可能多的人会面,最重要的是享受这一过程。
保持学习的成果
现在您已经开始学习,让我与您分享一些有关如何保留所学知识的技巧:
动手实施项目。从一个基础项目开始,然后扩大规模。将其与应用程序集成,部署在云平台上,等等。
费曼学习技术:
选择您想学习的概念
假装您正在将其教给6年级的学生
找出您的解释中的空白;回到原始资料,以更好地理解它。
审查并简化
您可以录制解释概念的视频,然后将其上传到YouTube。最后,您将拥有自己的视频注释以供参考。
社交媒体笔记
不仅YouTube,您还可以选择任何社交媒体,例如我将我的数字笔记保存在Instagram和Facebook上
建立您的数字档案不仅可以帮助您保留东西,还可以帮助您与业内其他人建立联系。您可以展示您的作品,与他人合作以及从事项目。这种做法将发展许多人缺乏的沟通和整体人格技能。
添加您在Github上执行的所有代码,并编写一个不错的readme.md。启动Blog或创建一个网站来展示您的工作(Google网站也足够)。只需数字记录您所做的每件事。Blogger,中型Facebook页面,您可以在任何地方编写。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群