数据科学与AI项目的生命周期
如何通过使用最新的最新AI技术堆栈从头构建项目?
在数据科学方面工作了几年后-丰富了产品,我们尝试了10多种不同的工作流程概念-采用了Scrum和敏捷,瀑布,迭代看板画布等。
结果,我们草拟了自己的数据科学项目开发??工作流,该工作流使我们可以迭代数据科学假设,处理和获取数据,构建和部署模型。
1.将业务流程和想法切入数据科学假设。H&T规格。
在与我们的核心AI团队进行头脑风暴会议期间,分解现有的业务流程或起草新的业务流程。分为现有数据,我们构建数据集格局,用于生成与每个业务任务相关的数据科学假设。我们创建了假设和测试用例(H&T)规范,以开始快速构建以AI为动力的MVP的原型。
2.快速定义的假设的原型。建立可用于生产的ML模型。
由我们的AI和HighLoad实验室组成的专门团队,对假设列表进行优先级排序,以识别关键指标-业务价值,KPI和模型准确性。 数据工程师准备现有公司的数据和获取的数据,以实现云(Google Cloud,AWS,Microsoft Azure)中的数据仓库,然后将其转发给数据科学团队以训练模型并检验假设。 如果假设满足准确性和边界业务KPI的要求,那么在训练和验证过程中就无法证明假设,从而得出经过验证的ML模型-任何AI技术驱动的MVP的核心组件。
3. ML模型部署和实际测试。提供AI驱动的MVP
将ML模型提供给现实世界需要适当的实时基础结构。我们使用最新的数据工程技术堆栈构建这样的库,将现有的业务逻辑和代码合并在一起。 在整个开发生命周期中,每种模型的业务KPI的度量是关键的影响因素。我们使用Tableau,Power BI,Looker??。 通过使用各种技术来提供基于AI的预测,评分,公认的模式,我们完成了业务任务并完成了MVP开发旅程。前往步骤1??

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!