新四季網

一種多雲監控告警方法及裝置與流程

2024-04-13 04:04:05



1.本發明涉及雲計算技術領域,尤其涉及一種多雲監控告警方法及裝置。


背景技術:

2.隨著物聯網時代的到來,各行各業對雲計算的需求越來越大,各種各樣的雲服務平臺應運而生,如阿里雲平臺等,因此部分企業同時採用多個雲服務平臺來處理企業業務數據。為了對多個雲服務平臺的雲資源進行統一監控,需要採用多雲管理平臺與多個雲服務平臺分別進行資源對接,包括對資源進行監控的功能的對接。然而,實踐發現,由於不同雲服務平臺的雲主機結構之間的差異較大,不同雲服務平臺對雲資源進行監控的原理和實現方式存在很大的區別,因此,多雲管理平臺在資源對接過程中需要分別適配每個雲服務平臺的整套資源監控方式,導致資源對接的工作量較大且重複率較高,且多雲管理平臺完成資源對接之後獲取到的資源監控功能的復用性較低。
3.可見,如何減少多雲管理平臺的資源對接的工作量、降低資源對接的重複率並提高資源監控功能的復用性顯得尤為重要。


技術實現要素:

4.本發明所要解決的技術問題在於,提供一種多雲監控告警方法及裝置,能夠減少多雲管理平臺的資源對接的工作量、降低資源對接的重複率並提高資源監控功能的復用性。
5.為了解決上述技術問題,本發明第一方面公開了一種多雲監控告警方法,所述方法應用於多雲管理平臺的雲資源監控和告警的實現,所述方法包括:
6.檢測所述多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,所述雲資源數據包括與所述多雲管理平臺對接的一個或多個雲服務平臺的子云資源數據,所述子云資源數據至少包括預先設定的至少一個監控數據指標;
7.當檢測出所述雲資源數據中存在所述異常數據指標時,根據所述異常數據指標對應的預設告警策略,對所述異常數據指標進行告警處理。
8.作為一種可選的實施方式,在本發明第一方面中,在所述根據所述異常數據指標對應的預設告警策略信息,對所述異常數據指標進行告警處理之前,所述方法還包括:
9.判斷所述異常數值指標處於所述異常狀態的持續時長是否大於所述異常數值指標對應的預設監測時長;
10.當判斷結果為是時,觸發執行所述的根據所述異常數據指標對應的預設告警策略信息,對所述異常數據指標進行告警處理的操作。
11.作為一種可選的實施方式,在本發明第一方面中,所述根據所述異常數據指標對應的預設告警策略信息,對所述異常數據指標進行告警處理,包括:
12.根據所述異常數據指標的指標信息,生成所述異常數據指標對應的告警消息;
13.根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處
理,所述告警傳輸處理用於向所述異常數據指標對應的告警人員發送所述告警消息。
14.作為一種可選的實施方式,在本發明第一方面中,在所述根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理之前,所述方法還包括:
15.判斷所述多雲管理平臺待告警的其他告警消息中是否存在所述告警消息對應的關聯告警消息,所述關聯告警消息包括與所述告警消息存在關聯關係的所述其他告警消息;
16.當判斷結果為是時,根據所述關聯關係以及所述關聯告警消息,對所述告警消息進行更新處理,並觸發執行所述的根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作。
17.作為一種可選的實施方式,在本發明第一方面中,所述根據所述關聯關係以及所述關聯告警消息,對所述告警消息進行更新處理,包括:
18.當所述關聯關係表示所述告警消息與所述關聯告警消息的屬性相似度大於預設相似度時,將所述告警消息與所述關聯告警消息進行合併為單個告警消息,作為更新後的告警消息;和/或,
19.當所述關聯關係表示所述告警消息對應的第一資源故障為所述關聯告警消息對應的第二資源故障所引起的後續資源故障時,或者,當所述關聯關係表示所述關聯告警消息對應的第二資源故障為所述告警消息對應的第一資源故障所引起的後續資源故障時,將所述告警消息與所述關聯告警消息進行合併為單個告警消息,作為更新後的告警消息。
20.作為一種可選的實施方式,在本發明第一方面中,所述方法還包括:
21.當所述關聯關係表示所述告警消息對應的第一資源故障為所述關聯告警消息對應的第二資源故障所引起的後續資源故障時,停止針對所述告警消息的告警傳輸處理;
22.當所述關聯關係表示所述關聯告警消息對應的第二資源故障為所述告警消息對應的第一資源故障所引起的後續資源故障時,停止針對所述關聯告警消息的告警傳輸處理。
23.作為一種可選的實施方式,在本發明第一方面中,在所述根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理之前,所述方法還包括:
24.判斷所述多雲管理平臺當前是否處於靜默狀態,所述靜默狀態用於表示所述多雲管理平臺不對外發送任意告警消息,當判斷出所述多雲管理平臺當前處於所述靜默狀態時,延後針對所述告警消息的告警傳輸處理;和/或,
25.判斷所述告警消息的屬性是否滿足靜默條件,當判斷出所述告警消息的屬性滿足所述靜默條件時,停止針對所述告警消息的告警傳輸處理;
26.其中,所述延後針對所述告警消息的告警傳輸處理,包括:
27.當所述多雲管理平臺結束所述靜默狀態時,觸發執行所述的根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作。
28.作為一種可選的實施方式,在本發明第一方面中,所述子云資源數據還包括一個或多個未監控數據指標,所述方法還包括:
29.當檢測到用戶在所述多雲管理平臺新建的告警規則條目時,根據所述告警規則條目,從所有所述未監控數據指標中確定與所述告警規則條目相匹配的目標數據指標,並將所述目標數據指標確定為新的監控數據指標,以使所述目標數據指標被納入所述多雲管理
平臺的監控告警範圍;
30.以及,所述方法還包括:
31.根據用戶在所述多雲管理平臺的空白告警規則頁面上輸入的告警規則信息,生成新的告警規則條目;和/或,
32.根據用戶在目標告警模板上輸入的告警規則信息,對所述目標告警模板上的可變信息進行變更,得到新的告警規則條目,所述目標告警模板包括用戶從所述多雲管理平臺的資料庫中預先調用的告警模板,所述可變信息至少包括所述目標告警模板中告警規則表達式模板的可變量;
33.其中,所述告警規則條目至少包括告警規則表達式,所述告警規則表達式用於指示所述告警規則條目的數據監控範圍和/或所述告警規則條目對應的告警觸發條件。
34.本發明第二方面公開了一種多雲監控告警裝置,所述裝置應用於多雲管理平臺的雲資源監控和告警的實現,所述裝置包括:
35.檢測模塊,用於檢測所述多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,所述雲資源數據包括與所述多雲管理平臺對接的一個或多個雲服務平臺的子云資源數據,所述子云資源數據至少包括預先設定的至少一個監控數據指標;
36.告警模塊,用於當所述檢測模塊檢測出所述雲資源數據中存在所述異常數據指標時,根據所述異常數據指標對應的預設告警策略,對所述異常數據指標進行告警處理。
37.作為一種可選的實施方式,在本發明第二方面中,所述裝置還包括:
38.判斷模塊,用於在所述告警模塊根據所述異常數據指標對應的預設告警策略,對所述異常數據指標進行告警處理之前,判斷所述異常數值指標處於所述異常狀態的持續時長是否大於所述異常數值指標對應的預設監測時長,當判斷結果為是時,觸發所述告警模塊執行所述的根據所述異常數據指標對應的預設告警策略信息,對所述異常數據指標進行告警處理的操作。
39.作為一種可選的實施方式,在本發明第二方面中,所述告警模塊根據所述異常數據指標對應的預設告警策略信息,對所述異常數據指標進行告警處理的具體方式,包括:
40.根據所述異常數據指標的指標信息,生成所述異常數據指標對應的告警消息;
41.根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理,所述告警傳輸處理用於向所述異常數據指標對應的告警人員發送所述告警消息。
42.作為一種可選的實施方式,在本發明第二方面中,所述告警模塊,還用於在執行所述的根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作之前,判斷所述多雲管理平臺待告警的其他告警消息中是否存在所述告警消息對應的關聯告警消息,所述關聯告警消息包括與所述告警消息存在關聯關係的所述其他告警消息;當判斷結果為是時,根據所述關聯關係以及所述關聯告警消息,對所述告警消息進行更新處理,並觸發執行所述的根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作。
43.作為一種可選的實施方式,在本發明第二方面中,所述告警模塊根據所述關聯關係以及所述關聯告警消息,對所述告警消息進行更新處理的具體方式,包括:
44.當所述關聯關係表示所述告警消息與所述關聯告警消息的屬性相似度大於預設
相似度時,將所述告警消息與所述關聯告警消息進行合併為單個告警消息,作為更新後的告警消息;和/或,
45.當所述關聯關係表示所述告警消息對應的第一資源故障為所述關聯告警消息對應的第二資源故障所引起的後續資源故障時,或者,當所述關聯關係表示所述關聯告警消息對應的第二資源故障為所述告警消息對應的第一資源故障所引起的後續資源故障時,將所述告警消息與所述關聯告警消息進行合併為單個告警消息,作為更新後的告警消息。
46.作為一種可選的實施方式,在本發明第二方面中,所述告警模塊,還用於當所述關聯關係表示所述告警消息對應的第一資源故障為所述關聯告警消息對應的第二資源故障所引起的後續資源故障時,停止針對所述告警消息的告警傳輸處理;當所述關聯關係表示所述關聯告警消息對應的第二資源故障為所述告警消息對應的第一資源故障所引起的後續資源故障時,停止針對所述關聯告警消息的告警傳輸處理。
47.作為一種可選的實施方式,在本發明第二方面中,所述告警模塊,還用於在執行所述的所述根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作之前,判斷所述多雲管理平臺當前是否處於靜默狀態,所述靜默狀態用於表示所述多雲管理平臺不對外發送任意告警消息,當判斷出所述多雲管理平臺當前處於所述靜默狀態時,延後針對所述告警消息的告警傳輸處理;和/或,判斷所述告警消息的屬性是否滿足靜默條件,當判斷出所述告警消息的屬性滿足所述靜默條件時,停止針對所述告警消息的告警傳輸處理;
48.其中,所述告警模塊延後針對所述告警消息的告警傳輸處理的具體方式,包括:
49.當所述多雲管理平臺結束所述靜默狀態時,觸發執行所述的根據所述異常數據指標對應的預設告警策略,對所述告警消息進行告警傳輸處理的操作。
50.作為一種可選的實施方式,在本發明第二方面中,所述子云資源數據還包括一個或多個未監控數據指標,所述裝置還包括:
51.確定模塊,用於當檢測到用戶在所述多雲管理平臺新建的告警規則條目時,根據所述告警規則條目,從所有所述未監控數據指標中確定與所述告警規則條目相匹配的目標數據指標,並將所述目標數據指標確定為新的監控數據指標,以使所述目標數據指標被納入所述多雲管理平臺的監控告警範圍;
52.以及,所述裝置還包括:
53.告警新增模塊,用於根據用戶在所述多雲管理平臺的空白告警規則頁面上輸入的告警規則信息,生成新的告警規則條目;和/或,根據用戶在目標告警模板上輸入的告警規則信息,對所述目標告警模板上的可變信息進行變更,得到新的告警規則條目,所述目標告警模板包括用戶從所述多雲管理平臺的資料庫中預先調用的告警模板,所述可變信息至少包括所述目標告警模板中告警規則表達式模板的可變量;
54.其中,所述告警規則條目至少包括告警規則表達式,所述告警規則表達式用於指示所述告警規則條目的數據監控範圍和/或所述告警規則條目對應的告警觸發條件。
55.本發明第三方面公開了另一種多雲監控告警裝置,所述裝置包括:
56.存儲有可執行程序代碼的存儲器;
57.與所述存儲器耦合的處理器;
58.所述處理器調用所述存儲器中存儲的所述可執行程序代碼,執行本發明第一方面
公開的多雲監控告警方法。
59.本發明第四方面公開了一種計算機存儲介質,所述計算機存儲介質存儲有計算機指令,所述計算機指令被調用時,用於執行本發明第一方面公開的多雲監控告警方法。
60.與現有技術相比,本發明實施例具有以下有益效果:
61.本發明實施例中,檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,雲資源數據包括與多雲管理平臺對接的一個或多個雲服務平臺的子云資源數據,子云資源數據至少包括預先設定的至少一個監控數據指標;當檢測出雲資源數據中存在異常數據指標時,根據異常數據指標對應的預設告警策略,對異常數據指標進行告警處理。可見,實施本發明能夠基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,此外,基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能。
附圖說明
62.為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
63.圖1是本發明實施例公開的一種多雲監控告警方法的流程示意圖;
64.圖2是本發明實施例公開的另一種多雲監控告警方法的流程示意圖;
65.圖3是本發明實施例公開的一種多雲監控告警裝置的結構示意圖;
66.圖4是本發明實施例公開的另一種多雲監控告警裝置的結構示意圖;
67.圖5是本發明實施例公開的又一種多雲監控告警裝置的結構示意圖。
具體實施方式
68.為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
69.本發明的說明書和權利要求書及上述附圖中的術語「第一」、「第二」等是用於區別不同對象,而不是用於描述特定順序。此外,術語「包括」和「具有」以及它們任何變形,意圖在於覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、裝置、產品或端沒有限定於已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對於這些過程、方法、產品或端固有的其他步驟或單元。
70.在本文中提及「實施例」意味著,結合實施例描述的特定特徵、結構或特性可以包含在本發明的至少一個實施例中。在說明書中的各個位置出現該短語並不一定均是指相同的實施例,也不是與其它實施例互斥的獨立的或備選的實施例。本領域技術人員顯式地和
隱式地理解的是,本文所描述的實施例可以與其它實施例相結合。
71.本發明公開了一種多雲監控告警方法及裝置,能夠基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,此外,基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能。以下分別進行詳細說明。
72.實施例一
73.請參閱圖1,圖1是本發明實施例公開的一種多雲監控告警方法的流程示意圖。其中,圖1所描述的多雲監控告警方法可以應用於多雲管理平臺的雲資源監控和告警的實現,具體的,該方法可以直接應用於多雲管理平臺中,也可以應用多雲管理平臺對應的關聯繫統中,本發明實施例不做限定。如圖1所示,該多雲監控告警方法可以包括以下操作:
74.101、檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標。
75.可選的,雲資源數據可以包括與多雲管理平臺對接的一個或多個雲服務平臺的子云資源數據,子云資源數據至少包括預先設定的至少一個監控數據指標,例如:內存使用率、cpu使用率、磁碟每秒讀次數、磁碟每秒寫次數、服務響應時間等。進一步可選的,多雲管理平臺可以與任意開源雲服務平臺和商用雲服務平臺進行對接,如:阿里雲平臺、華三平臺、openstack平臺、tstack平臺等,本發明實施例不做限定,多雲管理平臺與雲服務平臺進行對接後,多雲管理平臺可以管納雲服務平臺對應的虛擬機、容器、應用等雲資源。
76.作為一種可選的實施方式,檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,可以包括:
77.對於多雲管理平臺監控的雲資源數據中一個或多個監控數據指標,根據該監控數據指標對應的告警規則表達式,檢測該監控數據指標的指標數值是否滿足所述告警規則表達式所指示的告警觸發條件,當檢測結果為是時,確定雲資源數據中存在指標狀態處於異常狀態的異常數據指標。
78.可見,實施該可選的實施方式能夠提高異常數據指標檢測的準確性和可靠性。
79.102、當檢測出雲資源數據中存在異常數據指標時,根據異常數據指標對應的預設告警策略,對異常數據指標進行告警處理。
80.作為一種可選的實施方式,根據異常數據指標對應的預設告警策略信息,對異常數據指標進行告警處理,可以包括:
81.根據異常數據指標的指標信息,生成異常數據指標對應的告警消息;
82.根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理,告警傳輸處理用於向異常數據指標對應的告警人員發送告警消息。
83.可見,實施該可選的實施方式通過根據指標信息生成告警消息,再將告警消息發送給告警人員,能夠提高告警消息中的消息準確性和可靠性。
84.可選的,預設告警策略可以包括告警通知方式(如:簡訊、郵件、站內推送等)、告警通知範圍(如:需通知的人員範圍)、通知優先程度(如:一般、緊急、重大等)、告警通知次數、告警通知內容等中的一個或多個的組合。進一步可選的,在向告警人員發送告警消息之後,
告警人員可以直接在告警消息中查看異常數據指標的異常情況,也可以通過告警消息中的連結跳轉至告警人員的告警消息界面,並在告警消息界面中點擊異常數據指標對應的告警條目進行相關操作(如:查看、刪除、修改等)。
85.可見,實施本發明實施例能夠基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,此外,基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能。
86.在一個可選的實施例中,在根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理之前,該方法還可以包括:
87.判斷多雲管理平臺待告警的其他告警消息中是否存在告警消息對應的關聯告警消息,關聯告警消息包括與告警消息存在關聯關係的其他告警消息;
88.當判斷結果為是時,根據關聯關係以及關聯告警消息,對告警消息進行更新處理,並觸發執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作。
89.可見,實施該可選的實施例能夠將存在關聯關係的多個告警消息進行更新處理,進一步提高了告警消息的準確性和可讀性。
90.在該可選的實施例中,作為一種可選的實施方式,根據關聯關係以及關聯告警消息,對告警消息進行更新處理,可以包括:
91.當關聯關係表示告警消息與關聯告警消息的屬性相似度大於預設相似度時,將告警消息與關聯告警消息進行合併為單個告警消息,作為更新後的告警消息;和/或,
92.當關聯關係表示告警消息對應的第一資源故障為關聯告警消息對應的第二資源故障所引起的後續資源故障時,或者,當關聯關係表示關聯告警消息對應的第二資源故障為告警消息對應的第一資源故障所引起的後續資源故障時,將告警消息與關聯告警消息進行合併為單個告警消息,作為更新後的告警消息。
93.在該可選的實施方式中,可選的,告警消息的屬性可以包括相應異常數據指標所屬的雲服務平臺、資源類型、所屬的虛擬機、所屬的容器、所屬的應用、告警類型、指標類型等中一個或多個。
94.可見,實施該可選的實施方式能夠將屬性相似的多個告警消息或者存在因果關係的多個告警消息進行合併,能夠降低告警消息的冗餘程度,減輕多雲管理平臺的負荷,提高告警消息的可讀性,進而提升用戶體驗。
95.在該可選的實施例中,作為另一種可選的實施方式,該方法還可以包括:
96.當關聯關係表示告警消息對應的第一資源故障為關聯告警消息對應的第二資源故障所引起的後續資源故障時,停止針對告警消息的告警傳輸處理;
97.當關聯關係表示關聯告警消息對應的第二資源故障為告警消息對應的第一資源故障所引起的後續資源故障時,停止針對關聯告警消息的告警傳輸處理。
98.可見,實施該可選的實施方式能夠在某個告警消息的資源故障為其他資源故障所引發後續資源故障時,停止發送該告警消息,從而減少告警消息重複發送的情況發生,進一
步降低告警消息的冗餘程度,減輕多雲管理平臺的負荷,提高告警消息的可讀性,進而提升用戶體驗。
99.在該可選的實施例中,作為又一種可選的實施方式,在將告警消息與關聯告警消息進行合併為單個告警消息,作為更新後的告警消息後,根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理,可以包括:
100.根據異常數據指標對應的預設告警策略,判斷告警消息對應的告警人員與關聯告警消息對應的關聯告警人員是否相匹配;
101.當判斷結果為是時,根據預設告警策略,向告警人員發送更新後的告警消息;
102.當判斷結果為否時,對於告警人員中與關聯告警人員中重合的第一告警人員,向該第一告警人員發送更新後的告警消息,對於告警人員中與關聯告警人員中不重合的第二告警人員,向該第二告警人員發送更新前的告警消息。
103.可見,實施該可選的實施方式能夠向相關聯的告警消息對應的重合的告警人員發送合併後的告警消息,向不重合的告警人員發送合併前的告警消息,從而能夠在儘可能降低告警消息冗餘程度的情況下使得告警人員得以全面查看所需的告警消息,提高了告警消息發送的精準性。
104.在另一個可選的實施例中,在根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理之前,該方法還可以包括:
105.判斷多雲管理平臺當前是否處於靜默狀態,靜默狀態用於表示多雲管理平臺不對外發送任意告警消息,當判斷出多雲管理平臺當前處於靜默狀態時,延後針對告警消息的告警傳輸處理;和/或,
106.判斷告警消息的屬性是否滿足靜默條件,當判斷出告警消息的屬性滿足靜默條件時,停止針對告警消息的告警傳輸處理;
107.其中,延後針對告警消息的告警傳輸處理,可以包括:
108.當多雲管理平臺結束靜默狀態時,觸發執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作。
109.可選的,多雲管理平臺可以設定靜默機制,即在特定時間段內(如多雲管理平臺的伺服器升級維護的時間段內)或者告警消息的屬性滿足特定條件時不對外發送告警消息。
110.可見,實施該可選的實施例能夠在多雲管理平臺處於靜默狀態時延後發送告警消息,減少由於多雲管理平臺處於靜默狀態而導致告警消息發送失敗的情況,以及在告警消息的屬性滿足靜默條件時停止發送告警消息,實現了對告警消息的發送進行多樣靈活控制。
111.在又一個可選的實施例中,該方法還可以包括:
112.當檢測出雲資源數據中存在異常數據指標時,根據異常數據指標對應的預設告警策略,對異常數據指標對應的資源故障進行自動修正處理。
113.這樣能夠提高資源故障處理的智能性和效率。
114.實施例二
115.請參閱圖2,圖2是本發明實施例公開的另一種多雲監控告警方法的流程示意圖。其中,圖2所描述的多雲監控告警方法可以應用於多雲管理平臺的雲資源監控和告警的實現,具體的,該方法可以直接應用於多雲管理平臺中,也可以應用多雲管理平臺對應的關聯
系統中,本發明實施例不做限定。如圖2所示,該多雲監控告警方法可以包括以下操作:
116.201、檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標。
117.202、判斷異常數值指標處於異常狀態的持續時長是否大於異常數值指標對應的預設監測時長。
118.203、當檢測出雲資源數據中存在異常數據指標時,根據異常數據指標對應的預設告警策略,對異常數據指標進行告警處理。
119.本發明實施例中,針對步驟201、步驟203的其他描述,請參照實施例一中針對步驟101、步驟102的詳細描述,本發明實施例不再贅述。
120.可見,實施本發明實施例能夠基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,並且基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能,此外,在數據指標長期處於異常狀態時才觸發告警處理,能夠減少由於短時間內檢測錯誤而導致誤觸告警處理的情況發生,提高多雲管理平臺監控告警的準確性和可靠性。
121.在一個可選的實施例中,子云資源數據還可以包括一個或多個未監控數據指標,該方法還可以包括:
122.當檢測到用戶在多雲管理平臺新建的告警規則條目時,根據告警規則條目,從所有未監控數據指標中確定與告警規則條目相匹配的目標數據指標,並將目標數據指標確定為新的監控數據指標,以使目標數據指標被納入多雲管理平臺的監控告警範圍。
123.可選的,告警規則條目至少包括告警規則表達式,告警規則表達式用於指示告警規則條目的數據監控範圍和/或告警規則條目對應的告警觸發條件,進一步可選的,數據監控範圍包括告警規則條目對應的監控數據指標,告警規則條目還可以包括監控數據指標對應的預設告警策略、告警規則條目適用的資源類型、告警規則條目對應的監控周期以及告警規則條目的生效時長中的一個多個的組合。
124.可見,實施該可選的實施例能夠根據用戶新增的告警規則條目控制多雲管理平臺新增監控數據指標,有利於提高數據指標監控範圍的靈活性以及與用戶需求的匹配程度。
125.在另一個可選的實施例中,該方法還可以包括:
126.根據用戶在多雲管理平臺的空白告警規則頁面上輸入的告警規則信息,生成新的告警規則條目;和/或,
127.根據用戶在目標告警模板上輸入的告警規則信息,對目標告警模板上的可變信息進行變更,得到新的告警規則條目,目標告警模板包括用戶從多雲管理平臺的資料庫中預先調用的告警模板,可變信息至少包括目標告警模板中告警規則表達式模板的可變量。
128.在該可選的實施例中,可選的,告警模板用於對告警規則表達式中除可變量之外的信息(如格式等)進行固化,可變量可以包括告警規則表達式中的變量名稱、變量值、變量鍵值(如最大值、最小值、中位值、平均值等)、變量區間中的一個或多個。
129.可選的,多雲管理平臺的資料庫用於存儲雲服務平臺的業務數據,業務數據不僅包括告警模板,還可以包括告警消息對應的內容以及監控數據指標等。
130.可見,實施該可選的實施例能夠使得用戶可以從零開始創建告警規則條目,也可以通過告警模板創建告警規則條目,提高了告警規則條目創建的靈活性和多樣性,並且提高了告警規則條目創建的效率和便捷性。
131.實施例三
132.本發明實施例公開了又一種多雲監控告警方法,具體的,該方法可以應用於包含多雲監控系統(如:開源監控系統prometheus)和告警管理器(如:alertmanager)的多雲管理平臺中,以實現所云管理平臺的雲資源監控和告警。
133.具體的,該多雲監控告警方法可以包括以下操作:
134.一、多雲監控系統檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,當檢測出雲資源數據中存在異常數據指標時,生成異常數據指標對應的告警消息,並將告警消息發送至告警管理器。
135.具體的,多雲管理平臺的監控集群容器根據預先設定的告警規則條目接收與多雲管理平臺對接的一個或多個雲伺服器發送的雲資源數據,多雲監控系統根據告警規則條目對雲資源數據中的多個監控數據指標進行監控,以檢測雲資源數據中是否存在異常數據指標。
136.二、告警管理器根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理,告警傳輸處理用於向異常數據指標對應的告警人員發送告警消息。
137.具體的,告警管理器可以通過api接口接收多雲監控系統發送的告警消息。告警管理器可直接根據預設告警策略中的告警通知方式,向告警人員發送告警消息(例如,通過郵件、簡訊、站內推送等方式向告警人員發送告警消息),也可以在對告警消息進行相關處理(如分組、抑制、靜默等)後,再向告警人員發送告警消息。其中,分組處理用於表示將互相關聯的多個告警消息合併為單個告警消息;抑制處理用於表示在某個告警消息被觸發後,停止向告警人員發送由該告警消息對應的資源故障引發的其他告警消息;靜默處理用於表示在多雲管理平臺處於靜默狀態時或者告警消息的屬性滿足靜默條件時,延後或者停止向告警人員發送告警消息。
138.可見,實施本發明實施例基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,並且基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能。
139.實施例四
140.請參閱圖3,圖3是本發明實施例公開的一種多雲監控告警裝置的結構示意圖。其中,圖3所描述的多雲監控告警裝置可以應用於多雲管理平臺的雲資源監控和告警的實現,具體的,該方法可以直接應用於多雲管理平臺中,也可以應用多雲管理平臺對應的關聯繫統中,本發明實施例不做限定。如圖3所示,該多雲監控告警裝置可以包括:
141.檢測模塊301,用於檢測多雲管理平臺對應的雲資源數據中是否存在指標狀態處於異常狀態的異常數據指標,雲資源數據包括與多雲管理平臺對接的一個或多個雲服務平臺的子云資源數據,子云資源數據至少包括預先設定的至少一個監控數據指標;
142.告警模塊302,用於當檢測模塊301檢測出雲資源數據中存在異常數據指標時,根據異常數據指標對應的預設告警策略,對異常數據指標進行告警處理。
143.可見,實施圖3所描述的裝置能夠基於監控數據指標的方式使得多雲管理平臺同時多個雲服務平臺中的雲資源數據進行監控,無需多雲管理平臺分別適配每個雲服務平臺的整套資源監控方式,減少了多雲管理平臺資源對接的工作量,降低了資源對接的重複率,並且提高了資源監控功能的復用性,此外,基於監控數據指標的方式有利於實現多個雲服務平臺的雲資源數據進行分析對比,從而對多雲管理平臺的功能進行擴展,豐富了多雲管理平臺的功能。
144.在一個可選的實施例中,如圖4所示,該裝置還可以包括:
145.判斷模塊303,用於在告警模塊302根據異常數據指標對應的預設告警策略,對異常數據指標進行告警處理之前,判斷異常數值指標處於異常狀態的持續時長是否大於異常數值指標對應的預設監測時長,當判斷結果為是時,觸發告警模塊302執行上述的根據異常數據指標對應的預設告警策略信息,對異常數據指標進行告警處理的操作。
146.可見,實施圖4所描述的裝置在數據指標長期處於異常狀態時才觸發告警處理,能夠減少由於短時間內檢測錯誤而導致誤觸告警處理的情況發生,提高多雲管理平臺監控告警的準確性和可靠性。
147.在另一個可選的實施例中,如圖4所示,告警模塊302根據異常數據指標對應的預設告警策略信息,對異常數據指標進行告警處理的具體方式,可以包括:
148.根據異常數據指標的指標信息,生成異常數據指標對應的告警消息;
149.根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理,告警傳輸處理用於向異常數據指標對應的告警人員發送告警消息。
150.可見,實施圖4所描述的裝置還根據指標信息生成告警消息,再將告警消息發送給告警人員,能夠提高告警消息中的消息準確性和可靠性。
151.在又一個可選的實施例中,如圖4所示,告警模塊302,還用於在執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作之前,判斷多雲管理平臺待告警的其他告警消息中是否存在告警消息對應的關聯告警消息,關聯告警消息包括與告警消息存在關聯關係的其他告警消息;當判斷結果為是時,根據關聯關係以及關聯告警消息,對告警消息進行更新處理,並觸發執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作。
152.可見,實施圖4所描述的裝置還能夠將存在關聯關係的多個告警消息進行更新處理,進一步提高了告警消息的準確性和可讀性。
153.在又一個可選的實施例中,如圖4所示,告警模塊302根據關聯關係以及關聯告警消息,對告警消息進行更新處理的具體方式,可以包括:
154.當關聯關係表示告警消息與關聯告警消息的屬性相似度大於預設相似度時,將告警消息與關聯告警消息進行合併為單個告警消息,作為更新後的告警消息;和/或,
155.當關聯關係表示告警消息對應的第一資源故障為關聯告警消息對應的第二資源故障所引起的後續資源故障時,或者,當關聯關係表示關聯告警消息對應的第二資源故障為告警消息對應的第一資源故障所引起的後續資源故障時,將告警消息與關聯告警消息進行合併為單個告警消息,作為更新後的告警消息。
156.可見,實施圖4所描述的裝置還能夠將屬性相似的多個告警消息或者存在因果關係的多個告警消息進行合併,能夠降低告警消息的冗餘程度,減輕多雲管理平臺的負荷,提高告警消息的可讀性,進而提升用戶體驗。
157.在又一個可選的實施例中,如圖4所示,告警模塊302,還用於當關聯關係表示告警消息對應的第一資源故障為關聯告警消息對應的第二資源故障所引起的後續資源故障時,停止針對告警消息的告警傳輸處理;當關聯關係表示關聯告警消息對應的第二資源故障為告警消息對應的第一資源故障所引起的後續資源故障時,停止針對關聯告警消息的告警傳輸處理。
158.可見,實施圖4所描述的裝置還能夠在某個告警消息的資源故障為其他資源故障所引發後續資源故障時,停止發送該告警消息,從而減少告警消息重複發送的情況發生,進一步降低告警消息的冗餘程度,減輕多雲管理平臺的負荷,提高告警消息的可讀性,進而提升用戶體驗。
159.在又一個可選的實施例中,如圖4所示,告警模塊302,還用於在執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作之前,判斷多雲管理平臺當前是否處於靜默狀態,靜默狀態用於表示多雲管理平臺不對外發送任意告警消息,當判斷出多雲管理平臺當前處於靜默狀態時,延後針對告警消息的告警傳輸處理;和/或,判斷告警消息的屬性是否滿足靜默條件,當判斷出告警消息的屬性滿足靜默條件時,停止針對告警消息的告警傳輸處理;
160.其中,告警模塊302延後針對告警消息的告警傳輸處理的具體方式,可以包括:
161.當多雲管理平臺結束靜默狀態時,觸發執行上述的根據異常數據指標對應的預設告警策略,對告警消息進行告警傳輸處理的操作。
162.可見,實施圖4所描述的裝置能夠在多雲管理平臺處於靜默狀態時延後發送告警消息,減少由於多雲管理平臺處於靜默狀態而導致告警消息發送失敗的情況,以及在告警消息的屬性滿足靜默條件時停止發送告警消息,實現了對告警消息的發送進行多樣靈活控制。
163.在又一個可選的實施例中,如圖4所示,子云資源數據還可以包括一個或多個未監控數據指標,該裝置還可以包括:
164.確定模塊304,用於當檢測到用戶在多雲管理平臺新建的告警規則條目時,根據告警規則條目,從所有未監控數據指標中確定與告警規則條目相匹配的目標數據指標,並將目標數據指標確定為新的監控數據指標,以使目標數據指標被納入多雲管理平臺的監控告警範圍;
165.以及,該裝置還可以包括:
166.告警新增模塊305,用於根據用戶在多雲管理平臺的空白告警規則頁面上輸入的告警規則信息,生成新的告警規則條目;和/或,根據用戶在目標告警模板上輸入的告警規則信息,對目標告警模板上的可變信息進行變更,得到新的告警規則條目,目標告警模板包括用戶從多雲管理平臺的資料庫中預先調用的告警模板,可變信息至少包括目標告警模板中告警規則表達式模板的可變量;
167.其中,告警規則條目至少包括告警規則表達式,告警規則表達式用於指示告警規則條目的數據監控範圍和/或告警規則條目對應的告警觸發條件。
168.可見,實施圖4所描述的裝置還能夠根據用戶新增的告警規則條目控制多雲管理平臺新增監控數據指標,有利於提高數據指標監控範圍的靈活性以及與用戶需求的匹配程度;並且用戶可以從零開始創建告警規則條目,也可以通過告警模板創建告警規則條目,提高了告警規則條目創建的靈活性和多樣性,並且提高了告警規則條目創建的效率和便捷性。
169.實施例五
170.請參閱圖5,圖5是本發明實施例公開的又一種多雲監控告警裝置的結構示意圖。如圖5所示,該多雲監控告警裝置可以包括:
171.存儲有可執行程序代碼的存儲器401;
172.與存儲器401耦合的處理器402;
173.處理器402調用存儲器401中存儲的可執行程序代碼,執行本發明實施例一、實施例二以及實施例三中任一項所描述的多雲監控告警方法中的步驟。
174.實施例六
175.本發明實施例公開了一種計算機存儲介質,該計算機存儲介質存儲有計算機指令,該計算機指令被調用時,用於執行本發明實施例一、實施例二以及實施例三中任一項所描述的多雲監控告警方法中的步驟。
176.實施例七
177.本發明實施例公開了一種電腦程式產品,該電腦程式產品包括存儲了電腦程式的非瞬時性計算機可讀存儲介質,且該電腦程式可操作來使計算機執行實施例一、實施例二以及實施例三中任一項中所描述的多雲監控告警方法中的步驟。
178.以上所描述的裝置實施例僅是示意性的,其中所述作為分離部件說明的模塊可以是或者也可以不是物理上分開的,作為模塊顯示的部件可以是或者也可以不是物理模塊,即可以位於一個地方,或者也可以分布到多個網絡模塊上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下,即可以理解並實施。
179.通過以上的實施例的具體描述,本領域的技術人員可以清楚地了解到各實施方式可藉助軟體加必需的通用硬體平臺的方式來實現,當然也可以通過硬體。基於這樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該計算機軟體產品可以存儲在計算機可讀存儲介質中,存儲介質包括只讀存儲器(read-only memory,rom)、隨機存儲器(random access memory,ram)、可編程只讀存儲器(programmable read-only memory,prom)、可擦除可編程只讀存儲器(erasable programmable read only memory,eprom)、一次可編程只讀存儲器(one-time programmable read-only memory,otprom)、電子抹除式可複寫只讀存儲器(electrically-erasable programmable read-only memory,eeprom)、只讀光碟(compact disc read-only memory,cd-rom)或其他光碟存儲器、磁碟存儲器、磁帶存儲器、或者能夠用於攜帶或存儲數據的計算機可讀的任何其他介質。
180.最後應說明的是:本發明實施例公開的一種多雲監控告警方法及裝置所揭露的僅為本發明較佳實施例而已,僅用於說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解;其依然可以對前述各
項實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或替換,並不使相應的技術方案的本質脫離本發明各項實施例技術方案的精神和範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀