一種告警事件信息處理方法及裝置製造方法
2023-12-07 01:18:06 2
一種告警事件信息處理方法及裝置製造方法
【專利摘要】本發明公開了一種告警事件信息處理方法及裝置,主要內容包括:採集告警事件信息,確定告警事件信息中的告警時間和告警值,根據確定的預測模型參數和設定的預測模型對告警事件信息中包括的告警時間和告警值進行處理,獲得與網元對應的預測時長,所述預測時長是網元的告警事件類型所表示的告警事件由告警值變化為設定告警值需要的時間長度的估計值;根據告警值確定網元對應的告警級別;在告警級別達到設定級別時,輸出包含預測時長的告警信息。由於本發明實施例的方案對由告警值變化為設定告警值需要的時間長度的進行了估計並在告警消息中進行輸出,因此,使得告警維護人員可以準確獲知網元的告警值的動態變化趨勢,提高了告警信息輸出的有效性。
【專利說明】一種告警事件信息處理方法及裝置
【技術領域】
[0001]本發明涉及網絡管理【技術領域】,尤其涉及一種告警事件信息處理方法及裝置。
【背景技術】
[0002]通信網絡由多個通信設備構成,為了實現整個網絡的正常運行,需要對各個通信設備進行網絡監控。網絡監控技術就是對被監控設備的軟體及硬體的運行情況、任務執行情況等進行記錄或遠程查看,以了解其各項指標是否正常,被監控設備的某個物理設備或邏輯模塊出現異常時,會發送用於傳遞故障信息的事件報告,這種事件報告稱為告警信息。
[0003]具體實現上述功能的告警系統如圖1所示,該告警系統包括:被監控網元側的告警代理伺服器(Agent) 11和告警監控設備12,該系統的工作流程包括以下步驟:
[0004]第一步:被管網元側的告警代理伺服器根據告警監控設備既定的規則進行告警指標的輪詢檢測。
[0005]第二步:當指標的檢測值超出某一個既定的閾值後,被管網元側的告警代理伺服器以事件的形式向告警監控設備上報告警事件信息,該告警事件信息包含告警網元信息、告警指標、告警值。
[0006]第三步:告警監控設備接收到告警事件信息後,確定告警級別,參照既定處理規則觸發告警信息,該告警信息包括告警網元信息、告警指標、告警值和告警等級。
[0007]告警監控設備中對告警級別的定義一般分為一般告警、中等告警、嚴重告警和重大告警等幾個級別。不同告警指標的閥值取值可以不同,比較傳統的閥值定義為一般告警(告警指標全量的80%)、中等告警(告警指標全量的85%)、嚴重告警(告警指標全量的90%)、重大告警(告警指標全量的95%)。
[0008]第四步:根據告警等級的不同,告警系統將告警消息通過不同的通信形式通知給告警維護人員。
[0009]舉例來說:對於主機的文件系統告警,告警閥值定義一般如下佔用率超過85%後觸發中等告警;超過90%觸發嚴重告警;超過95%觸發重大告警;當告警系統檢測到文件系統超過85% (中等告警)和90% (嚴重告警)時,觸發簡訊提醒;當達到95% (重大告警)時,觸發值班平臺進行電話告警通知。
[0010]然而,上述告警系統使用的基於事件觸發的固定閾值告警模式,由於I)使用統一的固定閥值,會產生大量的垃圾告警信息(一般告警和中等告警),但如果直接過濾掉這些低級別告警,也有可能一些潛在的告警會被忽略;2)同一監控指標,其變化率具有一定的隨機性和突發性。對某些異常情況,所產生一般告警、中等告警時並未引起足夠的重視,而從一般/中等告警發展到嚴重告警的實際時長比往常正常情況要短許多,達到嚴重告警時再處理很可能來不及;3)告警內容往往只是某個時間點的告警值,給出的信息量不足以協助管理員進行更進一步的判斷;因此存在告警信息輸出的有效性不高的問題。
【發明內容】
[0011]本發明實施例提供了一種告警事件信息處理方法及裝置,用以解決現有的技術中輸出的告警信息的有效性不高的問題。
[0012]本發明實施例提供的具體技術方案如下:
[0013]一種告警事件信息處理方法,所述方法包括:
[0014]告警事件信息處理裝置採集告警事件信息,確定告警事件信息中的告警時間和告警值,所述告警事件信息中包含網元標識ID、該網元ID所表示的網元的告警事件類型、告警時間和該告警事件類型所表示的告警事件的告警值;
[0015]告警事件信息處理裝置根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長,所述預測時長是所述網元的告警事件類型所表示的告警事件由所述告警值變化為設定告警值需要的時間長度的估計值,所述設定的預測模型確定了告警時間和告警值之間的函數關係,所述預測模型參數是根據之前保存的告警事件信息中的告警時間和告警值確定的;
[0016]告警事件信息處理裝置根據告警值確定所述網元ID所表示的網元對應的告警級別;
[0017]告警事件信息處理裝置在告警級別達到設定級別時,輸出告警信息,所述告警信息中包含網元ID、告警事件類型、告警時間、告警值和預測時長。
[0018]一種告警事件信息處理裝置,所述裝置包括:
[0019]採集模塊,用於採集告警事件信息,確定告警事件信息中的告警時間和告警值,所述告警事件信息中包含網元標識ID、該網元ID所表示的網元的告警事件類型、告警時間和該告警事件類型所表示的告警事件的告警值;
[0020]預測時長確定模塊,用於根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長,所述預測時長是所述網元的告警事件類型所表示的告警事件由所述告警值變化為設定告警值需要的時間長度的估計值,所述設定的預測模型確定了告警時間和告警值之間的函數關係,所述預測模型參數是根據之前保存的告警事件信息中的告警時間和告警值確定的;
[0021]告警級別確定模塊,用於根據確定的所述告警值確定所述網元ID所表示的網元對應的告警級別;
[0022]告警信息輸出模塊,用於在告警級別達到設定級別時,輸出告警信息,所述告警信息中包含網元ID、告警事件類型、告警時間、告警值和預測時長。
[0023]本發明通過根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長,並在告警達到設定級別時,輸出包含用於表示告警事件由告警值變化為設定告警值需要的時間長度的估計值的預測時長,使得維護人員可以根據該預測時長來準確的確定告警事件的緊急程度,進而對該告警事件進行處理,也就是說,提高了告警信息輸出的有效性。
【專利附圖】
【附圖說明】
[0024]圖1為【背景技術】中的告警系統結構示意圖;
[0025]圖2為本發明實施例一中的告警信息處理方法流程示意圖;
[0026]圖3為本發明實施例一中告警狀態機模型示意圖;[0027]圖4為本發明實施例三中的告警事件信息處理裝置結構示意圖。
【具體實施方式】
[0028]下面結合說明書附圖,對本發明實施例提供的告警信息處理方法及裝置的【具體實施方式】進行說明。
[0029]實施例一
[0030]如圖2所示,為本發明實施例一的告警信息處理方法流程圖,所述方法包括以下步驟:
[0031]步驟101:告警事件信息處理裝置採集告警事件信息,確定告警事件信息中的告警時間和告警值。
[0032]所述告警事件信息中包含網元標識ID、該網元ID所表示的網元的告警事件類型、告警時間和該告警事件類型所表示的告警事件的告警值。
[0033]所述告警事件信息可以是從告警監控設備中採集的,告警監控設備可以對網元的狀況進行監控,在大於設定的告警閾值時,輸出告警事件信息。
[0034]步驟102:告警事件信息處理裝置根據確定的預測模型參數和設定的預測模型對確定的所述告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長;
[0035]所述設定的預測模型確定了告警時間和告警值之間的函數關係,所述預測模型參數是根據之前保存的告警事件信息中的告警時間和告警值確定的;
[0036]所述預測時長是所述網元的告警事件類型所表示的告警事件由告警值變化為設定告警值需要的時間長度的估計值。
[0037]所述設定告警值可以根據實際需求進行設定,例如設置為被監控網元所能達到的
最大告警值。
[0038]本步驟102中在需要監控的網元或網元的告警事件類型較多時,可以設置一用於定義需管理和監控的告警事件信息的歷史告警事件信息的資料庫,建立歷史告警事件信息庫,在該歷史告警事件信息庫中定義某次產生的告警事件信息,可以包括網元ID、告警事件類型、告警採集時間、告警值。其中,告警採集時間也即為告警時間。
[0039]以某一文件系統的告警事件信息為例,其歷史告警事件信息可以如表(1)所示:
[0040]
【權利要求】
1.一種告警事件信息處理方法,其特徵在於,所述方法包括: 告警事件信息處理裝置採集告警事件信息,確定告警事件信息中的告警時間和告警值,所述告警事件信息中包含網元標識ID、該網元ID所表示的網元的告警事件類型、告警時間和該告警事件類型所表示的告警事件的告警值; 告警事件信息處理裝置根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長,所述預測時長是所述告警事件類型所表示的告警事件由所述告警值變化為設定告警值需要的時間長度的估計值,所述設定的預測模型確定了告警時間和告警值之間的函數關係,所述預測模型參數是根據之前保存的告警事件信息中的告警時間和告警值確定的; 告警事件信息處理裝置根據確定的所述告警值確定所述網元ID所表示的網元對應的告警級別; 告警事件信息處理裝置在告警級別達到設定級別時,輸出告警信息,所述告警信息中包含網元ID、告警事件類型、告警時間、告警值和預測時長。
2.如權利要求1所述的方法,其特徵在於,所述預測時長包括第一預測時長和第二預測時長,所述第一預測時長是所述告警事件由所述告警值以正常的變化速度變化為設定告警值需要的時間長度的估計值;所述第二預測時長是所述告警事件由所述告警值以最快的變化速度變化為設定告警值需要的時間長度的估計值。
3.如權利要求2所述的方法,其特徵在於,所述方法還包括: 告警事件信息處理裝置在告警級別未達到設定級別但第二預測時長小於設定時長時,輸出告警信息。
4.如權利要求3所述的方法,其特徵在於,所述方法還包括: 告警事件信息處理裝置在告警級別未達到設定級別且第二預測時長不小於設定時長時,執行以下操作: 告警事件信息處理裝置根據第二預測時長確定告警輪詢的採集步長; 告警事件信息處理裝置以所述採集步長為採集時間間隔採集告警事件信息設定次數; 告警事件信息處理裝置利用採集的告警事件信息對所述預測模型參數進行更新; 告警事件信息處理裝置將更新後的預測模型參數作為確定的預測模型參數,將最近一次採集的告警事件信息中包含的告警時間和告警值作為確定的告警時間和告警值,並執行所述告警事件信息處理裝置根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理的步驟。
5.如權利要求2所述的方法,其特徵在於,所述設定的模型包括線性擬合預測模型和最劣情況預測模型,告警事件信息處理裝置根據確定的線性擬合模型參數和設定的線性擬合模型對所述告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的第一預測時長;告警事件信息處理裝置根據確定的最劣情況預測模型參數和最劣情況預測模型對所述告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的第二預測時長。
6.如權利要求5所述的方法,其特徵在於, 所述線性擬合預測模型為K = A+pXT ; 所述最劣情況預測模型為K=B+p』 XT ;其中:T為告警時間,K為告警值、P為線性擬合增長率,通過公式
7.如權利要求4所述的方法,其特徵在於,所述根據第二預測時長確定告警輪詢的採集步長,具體為:
8.一種告警事件信息處理裝置,其特徵在於,所述裝置包括: 採集模塊,用於採集告警事件信息,確定告警事件信息中的告警時間和告警值,所述告警事件信息中包含網元標識ID、該網元ID所表示的網元的告警事件類型、告警時間和該告警事件類型所表示的告警事件的告警值; 預測時長確定模塊,用於根據確定的預測模型參數和設定的預測模型對確定的告警時間和告警值進行處理,獲得所述網元ID所表示的網元對應的預測時長,所述預測時長是所述網元的告警事件類型所表示的告警事件由所述告警值變化為設定告警值需要的時間長度的估計值,所述設定的預測模型確定了告警時間和告警值之間的函數關係,所述預測模型參數是根據之前保存的告警事件信息中的告警時間和告警值確定的; 告警級別確定模塊,用於根據確定的所述告警值確定所述網元ID所表示的網元對應的告警級別; 告警信息輸出模塊,用於在告警級別達到設定級別時,輸出告警信息,所述告警信息中包含網元ID、告警事件類型、告警時間、告警值和預測時長。
9.如權利要求8所述的裝置,其特徵在於,所述預測時長包括第一預測時長和第二預測時長,所述第一預測時長是所述告警事件由所述告警值以正常的變化速度變化為設定告警值需要的時間長度的估計值;所述第二預測時長是所述告警事件由所述告警值以最快的變化速度變化為設定告警值需要的時間長度的估計值。
10.如權利要求9所述的裝置,其特徵在於, 所述告警信息輸出模塊,還用於在告警級別未達到設定級別但第二預測時長小於設定時長時,輸出告警信息。
11.如權利要求10所述的裝置,其特徵在於, 所述告警信息輸出模塊,還用於在告警級別未達到設定級別且第二預測時長不小於設定時長時,執行以下操作:根據第二預測時長確定告警輪詢的採集步長,以所述採集步長為採集時間間隔採集告警事件信息設定次數,利用採集的告警事件信息對所述預測模型參數進行更新,將更新後的預測模型參數作為確定的預測模型參數,將最近一次採集的告警事件信息中包含的告警時間和告警值作為確定的告警時間和告警值,並觸發預測時長確定模塊。·
【文檔編號】H04L12/24GK103856344SQ201210518655
【公開日】2014年6月11日 申請日期:2012年12月5日 優先權日:2012年12月5日
【發明者】方梅晶, 趙賀, 王春豔, 丁健, 楊海威, 姜宏巖 申請人:中國移動通信集團北京有限公司