Metaflow 是由 Netflix 开发,用在数据科学领域的 Python框架,于 2019 年 12 月正式对外开源。
Metaflow 在 Netflix 内部已经被用于各个方面的
机器学习任务,例如优化广告投递,视频编码等。Metaflow 其出现是为了提高模型的部署效率,让整个模型开发,部署,更新流程更加系统化,从而提高部署速度。
对数据科学家而言,他们更关注的是模型设计和特征工程等直接与模型性能相关的工作,并且希望能快速部署模型从而验证模型是否能在生产环境中有所提升,而不想在诸如环境依赖,版本控制,数据仓库管理等基本流程任务中浪费精力,Metaflow 的出现就是为了解决这个问题。
Metaflow 可以简化甚至自动完成底层任务,让数据科学家能更轻松,快速地部署模型,从而集中精力来提升模型性能以及在实际工程环境中的表现,提高生产力。因此,这是一款以人为中心的框架。近期,Netflix 也透露,Metaflow 已经将 Netflix 机器学习项目部署时间的中位数从四个月缩短到了仅仅7天。