作为数据科学行业的初学者,您一定阅读过无数描述创建数据科学项目重要性的文章。事实上,由于我在我的投资组合中展示的项目,我获得了我的第一个数据科学职位。
然而,并不是每个数据科学项目都能让你在这个行业中扮演一个角色。
我过去曾查看过数据科学申请人的简历,其中大多数人甚至没有进入面试阶段就被入门级职位拒绝了。
其中一些候选人确实在简历中包含了项目——但他们展示的项目太简单了。这些是他们在训练营或在线课程中创建的项目,对他们的应用程序弊大于利。
招聘人员会浏览同一个职位的一百多份简历。如果每个候选人都在其应用程序的项目部分展示了泰坦尼克号生存预测模型,那么他们之间就没有什么区别了。
要在申请工作时真正脱颖而出,重要的是要建立一些独特而有创意的东西。
招聘经理知道,在申请入门级职位时,您不可能掌握整个
机器学习工具堆栈。这不是他们想要的。技能可以随着时间的推移而磨练,你可以在工作中学到很多东西。
您需要做的就是比其他申请人更进一步。展示一个创意项目并围绕它讲述一个故事。这表明你对学习充满热情——你会花几个小时创造一些东西,不是因为你从中获得了立竿见影的收获,而仅仅是因为你喜欢这样做。这种学习意愿是大多数优秀经理和招聘人员积极寻找的特质,因为其他所有技能都可以随着时间的推移而磨练。
在本文中,我将为您提供一份
人工智能项目创意列表,这些创意将在您的简历中看起来很棒。
我已经提出了其中一些项目并自己构建了它们,如果有的话,我会为您提供指向它们的链接。我希望你能从其中一些项目中获得灵感,甚至可能想出你自己的版本。
名人相似模特
这是我去年创建的一个项目。我创建了一个 Web 应用程序,允许用户上传他们自己或其他人的照片,而底层的机器学习模型将预测他们的名人相似度。
我使用这个名人数据库来构建模型。我在后端使用了 Flask,在应用程序的前端使用了 Javascript 和 HTML。VGG16——一种流行的预训练
神经网络,用于模型训练。
你可以在这里找到这个项目的详细解释。
哈利波特性格预测
这是我一段时间前创建的另一个项目。我建立了一个文本预测模型,该模型可以根据用户输入的句子来预测用户的哈利波特人格双胞胎。
我为此任务使用了 MBTI 性格预测数据集,并根据我从 Google 搜索中获得的信息将每个哈利波特角色映射到各自的 MBTI 类型。
高度准确?可能不是。尽管如此,该模型的创建还是很有趣的。
为了执行这项任务,我尝试了一个 LSTM 模型(这是一种循环神经网络架构,通常用于预测序列,例如文本数据)。我还尝试使用内置在 FastAI 库中的预训练模型,并使用 MBTI 数据集再次对其进行训练。
最后,我创建了一个 Web 应用程序供用户输入句子,输出预测将呈现在屏幕上。该接口是使用名为 JupyterDash 的包创建的。
年龄检测模型
这是一个在许多现实世界场景中都有应用的项目理念。通常,未成年用户或掠夺者试图在友谊或约会平台上隐藏他们的年龄。其中许多应用程序没有得到很好的管理,并且其中许多配置文件最终未被检测到,从而导致了不幸的情况。
可以根据用户的个人资料图片吸引用户年龄的高度准确的模型可以帮助过滤和限制年龄不合适的用户。
以下是一些可以帮助您开始构建此模型的资源。
约会/友谊匹配算法
您是否曾经在约会网站上对某个人进行直接滑动,只是为了进行数小时无意义的对话,直到您意识到您与他们完全没有共同之处?
你可以创建一个匹配算法来解决这个问题!如果您是机器学习的初学者,您可以从一个简单的基于相关性的解决方案开始。
为每个用户创建一个用户资料数据集和一份调查问卷,以及基本的人口统计和兴趣详细信息。然后,您可以创建一个相关矩阵来对每个用户的答案之间的相似性进行评分,并相应地提供建议。
这是我找到的关于创建自己的配对算法的教程。试试看,然后添加你自己的旋转!
结论
上面列出的项目并不复杂。它们很简单,可以使用 OpenCV 等包中提供的预训练模型和模块构建。
将这些项目与我经常在候选人简历上看到的项目区分开来的主要因素是创造力。这些项目是不同的。他们试图解决现实世界中经常遇到的问题,或者玩起来很有趣。