一種雙重過濾的數據中心監控系統故障告警方法
2023-10-08 22:16:24 1
一種雙重過濾的數據中心監控系統故障告警方法
【專利摘要】本發明公開了一種雙重過濾的數據中心監控系統故障告警方法,結合故障告警多種故障狀態、多種通知方式和多個系統管理員的關聯關係,採用以資源監控模塊為基礎,配合資源故障告警過濾器和告警通知方式過濾器的雙重過濾設計方法,實現以通知處理引擎為連接點的雙重過濾體系,由通知處理引擎產生告警通知,再通過由不同告警級別、不同告警方式及不同類型管理員構建的立體通知策略的過濾。該一種雙重過濾的數據中心監控系統故障告警方法與現有技術相比,實現以通知處理引擎為連接點的雙重過濾體系,大大提高了監控系統故障告警的合理性和準確性,避免了因告警產生不合理、通知發送不準確和管理員權限分配受限制等的問題,實用性強。
【專利說明】一種雙重過濾的數據中心監控系統故障告警方法
【技術領域】
[0001]本發明涉及數據中心監控告警【技術領域】,具體地說是一種實用性強、雙重過濾的數據中心監控系統故障告警方法。
【背景技術】
[0002]隨著數據中心的飛速發展,現代化的數據中心越來越龐大、容納的設備資源越來越複雜、規模也越來越大。在數據中心的監控過程中,當產生故障告警時的通知策略則顯得尤其重要,傳統的故障告警方式如附圖1所示,只是單一的將某種故障告警以不同的告警方式將通知發送給所有的系統管理員,其告警通知的合理性和準確性都存在很大的問題。例如,一個具有十萬資源的現代化數據中心的監控,用傳統的故障告警策略進行告警通知,會將一個普通的故障告警不分級別和嚴重程度,以所能支持的幾種告警方式,同時發送給當前可以接收通知的各種角色的管理員,浪費告警資源的同時,也不同角色管理員之間的權限分配無法真正實現,往往造成有了故障不知道該哪些管理員去確認、去處理,嚴重影響了監控系統的可用性。以上挑戰為大規模數據中心的故障告警級別劃分、告警方式選擇和管理員權限分配等均帶了極大的局限性,嚴重影響大規模數據中心監控系統的發展,基於此,現提供一種可有效解決上述難題的雙重過濾的數據中心監控系統故障告警方法。
【發明內容】
[0003]本發明的技術任務是針對以上不足之處,提供一種實用性強、雙重過濾的數據中心監控系統故障告警方法。
[0004]一種雙重過濾的數據中心監控系統故障告警方法,其具體實現過程為:
設計資源監控模塊、資源故障告警過濾器、告警通知方式過濾器、通知處理引擎模塊,基於上述四種模塊,其具體告警過程為:
資源監控模塊根據監測參數,經過細粒度的劃分,生成以監測參數為單位的監測項,並以此監測項為單位進行數據採集,產生各自的故障告警狀態並選擇各自的告警方式;
然後,資源故障告警過濾器和告警通知方式過濾器模塊根據資源下屬各監測項進行輪詢數據採集時的故障狀態,將故障告警狀態、故障告警方式組合生成的第一層過濾器,基於該第一層過濾器產生的故障推送到通知處理引擎模塊進入下一層過濾;
最後,通知處理引擎模塊接收到經過第一層過濾器過濾的故障告警,生成告警通知後,再經由以資源故障告警狀態、故障告警方式和系統管理員的選擇組合為依據的第二層過濾器,將故障告警通知發送到負責處理故障的管理員處。
[0005]所述故障告警狀態包括故障恢復、一級警告、二級警告和無法連通四種,告警方式包括郵件、簡訊、窗口和聲音四種;
相對應的,第一層過濾器的生成過程為:
以資源故障級別為依據的故障恢復、一級警告、二級警告和無法連通四種級別自由組合的告警策略,以告警方式為依據的郵件、簡訊、窗口和聲音四種告警方式自由組合的告警策略,將兩種告警策略進行組合後生成上述第一層過濾器。
[0006]所述系統管理員包括多種角色,該系統管理員包括資料庫管理員、網絡設備管理員和機房環境管理;相對應的,所述第二層過濾器則以上述四種資源故障告警狀態、四種故障告警方式和多種系統管理員自由組合而成。本發明的一種雙重過濾的數據中心監控系統故障告警方法,具有以下優點:
該發明的一種雙重過濾的數據中心監控系統故障告警方法採用資源故障告警過濾器和告警通知方式過濾器的雙重過濾器設計方法,實現以通知處理引擎為連接點的雙重過濾體系,大大提高了監控系統故障告警的合理性和準確性,避免了因告警產生不合理、通知發送不準確和管理員權限分配受限制等的問題,實用性強,適用範圍廣泛,易於推廣。
【專利附圖】
【附圖說明】
[0007]附圖1為傳統的數據中心監控系統故障告警策略原理示意圖。
[0008]附圖2為資源故障告警過濾器與告警通知方式過濾器原理示意圖。
[0009]附圖3為通知處理引擎模塊示意圖。
[0010]附圖4為雙重過濾的數據中心監控系統故障告警策略原理示意圖。
【具體實施方式】
[0011]下面結合附圖和具體實施例對本發明作進一步說明。
[0012]本發明提出一種雙重過濾的數據中心監控系統故障告警方法,該方法充分發揮雙重過濾機制在數據中心監控系統故障告警時的優勢,考慮故障告警時多種故障狀態、多種通知方式和多個系統管理員之間非常複雜的關聯關係的特點,採用以資源監控模塊為基礎,配合資源故障告警過濾器和告警通知方式過濾器的雙重過濾設計方法,實現以通知處理引擎為連接點的雙重過濾體系,資源發生故障時可以觸發由不同告警級別、不同告警方式組成的告警策略,經由通知處理引擎產生告警通知對象,再通過由不同告警級別、不同告警方式及各種類型管理員構建的立體通知策略的過濾,最終達到當一個資源產生告警後可以迅速地、準確地將告警通知發送到負責處理此故障的管理員處,從而大大提高了監控系統故障告警的合理性和準確性,避免了因告警產生不合理、通知發送不準確和管理員權限分配受限制等的問題。如附圖2、圖3、圖4所示,其具體實現過程為:
設計資源監控模塊、資源故障告警過濾器、告警通知方式過濾器、通知處理引擎模塊,基於上述四種模塊,其具體告警過程為:
資源監控模塊設計按不同的監測參數,經過細粒度的劃分,生成以每種監測參數為單位的監測項(如Windows作業系統的CPU利用率、Linux作業系統的CPU負載等),並以此監測項為單位進行數據採集,產生各自的故障告警狀態(故障恢復、一級警告、二級警告和無法連通共四種),選擇各自的告警方式(郵件、簡訊、窗口和聲音共四種)。
[0013]資源故障告警過濾器和告警通知方式過濾器根據資源下屬各監測項進行輪詢數據採集時的故障狀態,設計以資源故障級別為依據的故障恢復、一級警告、二級警告和無法連通四種級別自由組合的告警策略,設計以告警方式為依據的郵件、簡訊、窗口和聲音四種告警方式自由組合的告警策略,並將兩種告警策略再進行組合後生成第一層過濾器,基於此將產生的故障告警推送到通知處理引擎模塊進入下一層過濾。
[0014]通知處理引擎模塊接收到上述的經過第一層過濾器過濾的故障告警,啟動通知處理引擎將故障告警轉化為告警通知。告警通知生成後,開始進入第二層過濾器進行第二次過濾。其中,第二層過濾器在以四種資源故障級別為依據和以四種告警方式為依據的前提下,又增加了多種角色的系統管理員的選擇和組合,也就是說,第二層過濾器是由四種資源故障級別(故障恢復、一級警告、二級警告和無法連通)、四種告警方式(郵件、簡訊、窗口和聲音)和η種角色的系統管理員(如資料庫管理員、網絡設備管理員和機房環境管理等)自由組合而成。
[0015]實施例:
如附圖4所示,所述Windows伺服器資源共設置三個監測項,分別為伺服器內存狀態、伺服器所在機房運行環境情況和伺服器網卡狀態,每個監測項進行各自的輪詢數據採集,將採集到的數據與預設告警閥值對比後,產生各自的監測狀態,當出現故障恢復、一級警告、二級警告或無法連通狀態時則產生故障告警。例如,第一種情況伺服器內存壞了,則需要通過雙重過濾的故障告警策略進行過濾,當為一級警告或二級警告狀態的故障告警時,以郵件、簡訊的方式將告警通知發送給負責伺服器運行的管理員;當為無法連通狀態的故障告警時,以聲音或簡訊的方式將告警通知發送給負責伺服器硬體維護的管理員。第二種情況伺服器網卡出現故障時,當為一級警告或二級警告狀態時,以郵件或窗口的方式將告警通知發送給負責伺服器運行的管理員和負責網絡運行的管理員;當為無法連通狀態時,以簡訊、聲音或窗口的方式將告警通知發送給負責伺服器硬體維護的管理員、負責網絡設備維護的管理員、負責網絡運行的管理員等。
[0016]上述【具體實施方式】僅是本發明的具體個案,本發明的專利保護範圍包括但不限於上述【具體實施方式】,任何符合本發明的一種雙重過濾的數據中心監控系統故障告警方法的權利要求書的且任何所述【技術領域】的普通技術人員對其所做的適當變化或替換,皆應落入本發明的專利保護範圍。
【權利要求】
1.一種雙重過濾的數據中心監控系統故障告警方法,其特徵在於,其具體實現過程為: 設計資源監控模塊、資源故障告警過濾器、告警通知方式過濾器、通知處理引擎模塊,基於上述四種模塊,其具體告警過程為: 資源監控模塊根據監測參數,經過細粒度的劃分,生成以監測參數為單位的監測項,並以此監測項為單位進行數據採集,產生各自的故障告警狀態並選擇各自的告警方式; 然後,資源故障告警過濾器和告警通知方式過濾器模塊根據資源下屬各監測項進行輪詢數據採集時的故障狀態,將故障告警狀態、故障告警方式組合生成的第一層過濾器,基於該第一層過濾器產生的故障推送到通知處理引擎模塊進入下一層過濾; 最後,通知處理引擎模塊接收到經過第一層過濾器過濾的故障告警,生成告警通知後,再經由以資源故障告警狀態、故障告警方式和系統管理員的選擇組合為依據的第二層過濾器,將故障告警通知發送到負責處理故障的管理員處。
2.根據權利要求1所述的一種雙重過濾的數據中心監控系統故障告警方法,其特徵在於,所述故障告警狀態包括故障恢復、一級警告、二級警告和無法連通四種,告警方式包括郵件、短?目、窗口和聲音四種; 相對應的,第一層過濾器的生成過程為: 以資源故障級別為依據的故障恢復、一級警告、二級警告和無法連通四種級別自由組合的告警策略,以告警方式為依據的郵件、簡訊、窗口和聲音四種告警方式自由組合的告警策略,將兩種告警策略進行組合後生成上述第一層過濾器。
3.根據權利要求2所述的一種雙重過濾的數據中心監控系統故障告警方法,其特徵在於,所述系統管理員包括多種角色,該系統管理員包括資料庫管理員、網絡設備管理員和機房環境管理;相對應的,所述第二層過濾器則以上述四種資源故障告警狀態、四種故障告警方式和多種系統管理員自由組合而成。
【文檔編號】H04L12/24GK104468224SQ201410785902
【公開日】2015年3月25日 申請日期:2014年12月18日 優先權日:2014年12月18日
【發明者】陸峰, 劉成平, 李鋒 申請人:浪潮電子信息產業股份有限公司