文 / 缺月,阿里巴巴
原文:https://juejin.im/post/5e154082e51d45411a0ebda1
背景
随着深度学习的发展,智能化已经开始赋能各行各业,前端作为互联网中离用户最近的一环,也希望借助 AI 的能力大幅提高效率,减少人力成本,给用户创建更好的体验。因此,前端智能化也被看作是前端的未来的重要发展方向。
传统的前端工程师对深度学习本身的算法和原理不了解,导致很难直接使用一些现有的机器学习框架 (TensorFlow,Pytorch 等)来进行训练。
为了解决这些问题,推动前端智能化发展,我们开发了 pipcook。pipcook 使用对前端友好的 JS 环境,基于 TensorFlow.js 框架作为底层算法能力并且针对前端业务场景包装了相应算法,从而让前端工程师可以快速简单的运用起机器学习的能力。
此篇文章将主要讨论 pipcook 是如何和 TensorFlow.js 结合的,重点探讨一下如何利用 tfjs-node 的底层模型和计算能力搭建一个高阶机器学习流水线,您可以在这里参考 pipcook (https://github.com/alibaba/pipcook) 的更多信息。
为什么采用 TensorFlow.js 作为底层算法框架
tfjs 提供了 Dataset API, 可以对数据进行抽象,为数据封装了简单高效的接口,同时可以进行批数据处理。Dataset API 的数据流的方式也可以和 pipcook 管道的方式高效结合。
使用 TensorFlow.js 处理数据
对于机器学习,访问和处理大量数据是一个关键问题。对于一些传统数据量不大的场景,我们可以把数据一次性读入内存进行操作,但是对于深度学习来说,很多时候数据远远超出了内存大小,因此,我们需要按需从数据源逐段访问数据的能力。而 tfjs 提供的 Dataset API 对这种场景的处理进行了包装。
随后,在 model load 中,数据会以 batch 的形式读入模型进行训练
至此,我们可以将数据集想象为一组训练数据的可迭代集合,如同 Node.js 中的 Stream。每当从数据集中请求下一个元素时,内部实现都会根据需要进行访问,并且执行预先设置好的数据处理操作函数。这种抽象使得模型可以轻松训练大量的数据。当我们有多个数据集时,Dataset 还便于将数据集共享和组织为同一组抽象。
训练模型
TensorFlow.js 分成低阶与高阶两组 API。低阶的 API 是由 deeplearn.js 衍生,包含搭建模型所需要的 operator (OP),负责处理一些低阶如线性代数的数据运算等等,来协助我们处理机器学习中的数学运算部分。而高阶的 Layers API 则是用来包装一些常用的机器学习的算法,同时允许我们载入训练好的模型,像是由 Keras 学习的模型等等。
pipcook 通过插件的方式开发和运行模型,每个 model load 插件会负责加载某一具体的模型,大部分模型基于 tfjs 实现。同时 tfjs-node 还提供了 GPU 加速等功能,可以提高模型训练的速度。同时,我们还会使用 tfjs-converter 将一些 Python 模型转化过来再进行进一步的迁移学习。
部署
对于一条工业级的机器学习流水线,在训练模型完成之后,还需要有一种方式部署您的模型,从而让模型可以为真实的业务服务,目前 pipcook 部署的方案主要有以下几种,这些方案都是通过 model deploy 插件完成的:
快速验证方案:很多时候您可能想要对您的数据和模型进行快速的实验,例如使用小批量的数据和数量较少的 epoch,对于这种场景,我们不需要将模型部署到远程再进行验证。对此,pipcook 内置了本地部署的插件,在机器上训练完成之后,pipcook 将会在本地启动一个预测服务器,进行预测服务
服务器 docker 镜像:pipcook 提供了官方镜像,此官方镜像包含了 pipcook 训练和预测的必要环境,您可以直接将此镜像部署到您的部署主机上,也可以使用 k8s 等集群解决方案管理 docker 镜像
云服务打通:pipcook 将会在后续开发中逐渐打通各云服务厂商的机器学习部署服务,现阶段实际上 Gcloud 已经提供了 tfjs 和 automl 的结合,后续 pipcook 将会逐渐支持阿里云,AWS 等服务
和 TFX (TensorFlow Extended) 的对比
同时,我们设计的 API 也是基于 JS 习惯的,对前端来说学习和上手的成本较低
基于以上这些设计,我们尽量尝试去构建一个对前端友好的机器学习环境,从而达到我们的预期和目标。
未来展望
pipcook 自开源以来已经有半年的时间,期间,也收到了一些用户的反馈,也获得一些外部开发者的支持。我们也期望可以借助开源社区的力量,不断完善 pipcook,使其可以真正助力前端智能化。同时,我们希望可以进一步和 tfjs 进行深度的打通,和 tfjs 团队进行更加深度的合作,争取可以在基于 tfjs 的基础上提供出更多的能力,包括算法能力和预测加速等,真正建立一个属于 JS 的,属于前端开发者的机器学习繁荣生态!
如何贡献?
如果您对我们的项目有兴趣并且想要为前端智能化贡献一份力量,欢迎您前往我们的 github 开源仓库 (https://github.com/alibaba/pipcook)。
更多相关案例:
加入案例分享,请点击 “阅读原文” 填写您的用例与相关信息,我们会尽快与你联系。