PAI Online Learning是PAI平台新推出的流式机器学习功能,依托于阿里实时计算平台Flink以及数据计算处理平台MaxCompute,既能够发挥离线训练对大规模数据的强大处理能力,又能够发挥流式机器学习算法对实时模型的更新能力,做到流批同跑,完美解决模型时效性的问题。
核心能力
流批一体化
与PAI既有离线训练功能完美融合,集成大量现有的离线算法与丰富的流式算法,包括FTRL等。用户通过简单拖拉拽即可实现数据源、算法、批流模型转换等各类组件的拼装,实现流批同跑。同时,因为底层高效的流计算引擎Flink和高性能的数据处理平台MaxCompute的支持,为用户提供了强大的性能支撑。
支持多种数据源
封装了多种常用的数据源,包括ODPS表、Datahub流式数据等数据源,给用户更多的选择,前期数据处理及分析链路更加通畅。
实时模型训练与部署
随着源源不断的流式数据输入,模型实时更新部署,对外提供服务,满足用户对动态变化的场景即时作出反应的需求。
数据可视化
提供可视化大屏,支持流式数据的可视化,能够实时的显示流式数据的分析结果,辅助客户做出商业决策。
功能优势
灵活易用
与PAI机器学习平台目前拖拉拽操作方式一致,零学习成本。丰富的界面元素,多种运行日志展示,更好的用户体验。
一站式服务
流式算法训练生成的、不断更新的模型可以直接在PAI-EAS在线预测服务引擎进行部署也可以下载下来到本地预测引擎使用。
服务稳定
深度优化的集群环境,多渠道的在线支持,持续更新丰富的算法组件。