一站式ai綜合運維平臺(詳解AIOps智能運維基本概念)
2023-07-29 23:24:01 2
概述很多人可能只是了解過DevOps,AIOps可能沒怎麼去了解,今天主要介紹下AIOps的概念、目標、原則和能力分級。
AIOps,即 Artificial Intelligence for IT Operations,智能運維,將人工智慧應用於運維領域,基於已有的運維數據(日誌、監控信息、應用信息等),通過機器學習的方式來進一步解決自動化運維沒辦法解決的問題。
早期的運維工作大部分是由運維人員手工完成的,這被稱為手工運維或人肉運維。這種落後的生產方式,在網際網路業務快速擴張、人力成本高企的時代,難以維繫。
AIOps,通俗的講,是對規則的AI化,即將人工總結運維規則的過程變為自動學習的過程。
具體而言,是對我們平時運維工作中長時間積累形成的自動化運維和監控等能力,將其規則配置部分,進行自學習的「去規則化」改造,最終達到終極目標:「有AI調度中樞管理的,質量、成本、效率三者兼顧的無人值守運維,力爭所運營系統的綜合收益最大化」。
AIOps 目標利用大數據、機器學習和其他分析技術,通過預防預測、個性化和動態分析,直接和間接增強IT業務的相關技術能力,實現所維護產品或服務的更高質量、合理成本及高效支撐。
AIOps 指導原則AIOps的建設可以先由無到局部單點探索、再到單點能力完善,形成解決某個局部問題的運維AI「學件」,再有多個具有AI能力的單運維能力點或學件組合成一個智能的運維流程,如智能化的監控預測及告警,免幹預的自動化擴縮容,免幹預的性能調優、免幹預的成本組成調優等。
具體可描述為5級:
1)開始嘗試應用AI能力,還無較成熟單點應用2)具備單場景的AI運維能力,可以初步形成供內部使用的學件3)有由多個單場景AI運維模塊串聯起來的流程化AI運維能力,可以對外提供可靠的運維AI學件4)主要運維場景均已實現流程化免幹預AI運維能力,可以對外提供可靠的AIOps服務。5) 有核心中樞AI,可以在成本、質量、效率間從容調整,達到業務不同生命周期對三個方面不同的指標要求,可實現多目標下的最優或按需最優。
AIOps 是 企業級 DevOps 在運維(技術運營)側的高階實現。
AIOps 和 DevOps 兩者並不衝突,企業級 DevOps 涵括包括運維在內的整個軟體生命周期。
自動化做devops,專業化做Dataops,智能化做AIOps!
AIOps是一項十年以上的大項目,值得我們去探索落地實踐,有興趣的朋友可以深入研究下。