1. MLOps是什么?
MLOps(Machine Learning Operations)是面向機器學習項目的研發運營管理體系,目的是連接業務團隊、AI團隊和運營團隊,建立一套標準化的模型開發、部署及運營流程,來管理機器學習項目的全生命周期。
Google 的團隊一直在對構建基于 ML 的系統所帶來的技術挑戰進行大量研究。 一篇關于機器學習系統中隱藏的技術債務的 NeurIPS 論文表明,開發模型只是整個過程的一小部分。 許多其他流程、配置和工具將被集成到系統中。如下圖所示:

因此MLOps的核心價值在于,解決機器學習項目角色間溝通壁壘。ML項目研發過程中各角色之間(業務人員、AI工程師、數據科學家、運維工程師等)存在著天然鴻溝,而打破溝通屏障,構建暢通的協作平臺,降低合作成本,是讓項目順利開展的前提。同時使AI工程師不用再淪陷于處理繁瑣的模型更新和維護等工作,而可潛心鉆研更有價值的內容。
2. MLOps的發展趨勢
MLOps是機器學習項目走向規模化應用的有效途徑,通過持續訓練、持續集成、持續部署、持續監控等多個自動化循環流程,大大減少開發周期,提升交付質量,降低人員依賴,提高研發效能,推動挖掘更多元化的業務價值。
借鑒DevOps精髓,MLOps從需求到模型維護的全鏈路,以及模型開發及訓練的子鏈路,和模型部署及監控的子鏈路,都秉承著持續閉環的全生命周期管理模式。
持續訓練CT,實驗階段模型的持續訓練能大大降低AI工程師時間成本,上線模型的持續訓練能提高模型服務質量,及時應對數據漂移和內容漂移等風險。
持續集成CI和持續部署CD,以達到隨時隨地輕松部署ML模型目的。
持續監控CM,持續開展線上的模型和業務監控,根據監控報警開展模型重復訓練和更新,維持和提高模型推理質量,持續創造高水準業務價值。
流水線Pipelines,數據處理流水線、模型開發流水線、集成交付流水線的構建,最大程度提高自動化水平,高效率實現ML項目全生命周期管理。
特征管理、算法管理、模型管理,通過對特征、算法和模型的存儲及管理,最大限度發揮各類資產的價值,減少重復造輪子的組織級成本,提高統籌管理效能。
版本管理,模型的版本管理即對數據、算法、模型等資產完整性及可追溯性的集中管理,能隨時重現任何時刻的模型快照。
自動化測試,集成自動測試工具,提高測試的自動化水平,包括組件測試、數據驗證、模型驗證等,進而提高全鏈路持續化水平。
工程化使懸在云端的AI夢想終于落地變成現實,而MLOps是工程化助推劑。未來MLOps的發展將在流水線間的連通性、模型線上自更新、資源伸縮性管理、模型自動調參、模型可解釋性、模型安全性及公平性等方面得到進一步的探索和實踐。
人工智能已走入千家萬戶,MLOps走入千家萬企已指日可待,未來可期。
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
關于億道電子
億道電子技術有限公司(英文名稱:Emdoor Electronics Technology Co.,Ltd)是國內資深的研發工具軟件提供商,公司成立于 2002 年,面向中國廣大的制造業客戶提供研發、設計、管理過程中使用的各種軟件開發工具,致力于幫助客戶提高研發管理效率、縮短產品設計周期,提升產品可靠性。

歡迎關注“億道電子”公眾號
了解更多研發工具軟件知識

首頁 > 新聞資訊
