一種告警信息的處理方法及設備與流程
2023-05-05 00:35:46 3
本發明涉及通信技術領域,特別涉及一種告警信息的處理方法。本發明同時還涉及一種告警信息的處理設備。
背景技術:
在現有技術中,外圍單板在產生告警信息後,即將該告警信息攜帶其產生時間一同發送至全局單版,全局單板根據接收到的告警信息及其產生時間,打上時間標籤後發送該告警信息至控制臺,具體的告警信息的觸發流程圖如圖1所示。在外圍單板因故復位重啟後,其單板上的告警信息會清除。當全局單板在檢測到對應的外圍單板發生了復位重啟,亦會將該單板上的告警信息全部執行清除操作,並通知控制臺將對應單板上的告警信息同步執行刪除操作。為了保留復位重啟的外圍單板的告警信息,現有技術在對應的外圍單板重啟後,使其重新上報該單板上的告警信息。相應地,全局單板將收到的告警信息打上新的產生時間標籤,同時將對應的告警信息上報給控制臺進行顯示。然而,外圍板在重新上報告警信息時會攜帶新的時間,這會導致對應告警實際的最開始發生的故障時間和上報告警的時間不匹配,從而篡改了設備對象故障的實際時間,或者無法正確標識對應告警實際的故障時間,使得控制臺的操作用戶對對應對象的故障時間產生誤解,削弱了用戶對告警處理的重視程度,延緩了告警故障處理的時間,為其它故障的發生帶來了一定的風險。
技術實現要素:
本發明提供了一種告警信息的處理方法,用以確保單板復位後其對應的 已上報告警信息仍然維持原來的告警產生時間,包括:判斷在預設的時間閾值內是否有接收到與復位單板對應的重啟指示信息;若是,保留所述復位單板在復位前上報的告警信息;若否,刪除所述復位單板在復位前上報的告警信息。另一方面,本發明還提出了一種告警信息處理設備,包括:判斷模塊,用於判斷在預設的時間閾值內是否有接收到與復位單板對應的重啟指示信息;處理模塊,用於在所述判斷模塊判斷在預設的時間閾值內接收到與復位單板對應的重啟指示信息時,保留所述復位單板在復位前上報的告警信息;在所述判斷模塊判斷在預設的時間閾值內沒有接收到與復位單板對應的重啟指示信息時,刪除所述復位單板在復位前上報的告警信息。通過應用以上技術方案,針對復位單板在復位前上報的告警信息設置延時處理機制,若在預設的時間內收到復位單板的重啟消息則保留相應的告警信息,從而使對應單板故障告警發生的時間不會因單板復位而發生改變,為故障問題的解決提供了原始數據支撐,避免了操作用戶對故障告警時間的錯誤判斷。附圖說明圖1為現有技術中告警信息的觸發流程圖;圖2為本發明提出的一種告警信息處理方法流程示意圖;圖3為本發明具體實施例提出的冗餘告警信息處理流程示意圖;圖4為本發明具體實施例提出的故障告警產生消息的處理流程示意圖;圖5為本發明提出的一種告警信息處理設備的結構示意圖。具體實施方式如背景技術所述,現有的外圍單板在復位後其單板對應的已上報告警信息會被清除;而在對應的外圍單板復位重啟後,其重新上報的告警信息的時間會發生變更。有鑑於此,本發明提出了一種告警信息處理方法,用以確保單板復位後其對應的已上報告警信息仍然維持原來的告警產生時間,從而使對應單板故障告警發生的時間不會因單板復位而發生改變,避免了操作用戶對故障告警時間的錯誤判斷。如圖2所示,為本發明提出的一種告警信息處理方法流程示意圖,包括以下步驟:S201,判斷在預設的時間閾值內是否有接收到與復位單板對應的重啟指示信息,若是,轉至S202;若否,轉至S203。需要說明的是,在該判斷過程之前,還會根據復位單板的CPU地址信息確定是否存在與該復位單板關聯的備用單板。從而為後續的原有告警信息處理以及新接到的告警信息的處理過程提供不同的判斷依據。S202,保留所述復位單板在復位前上報的告警信息。如果不存在與復位單板關聯的備用單板,則只需在接收到該復位單板的重啟指示消息後保留該復位單板在復位前上報的告警信息即可。如果存在與復位單板關聯的備用單板,則由備用單板發送對應的重啟指示消息,此時除了保留該復位單板在復位前上報的告警信息之外,同時還需要為其對應的備用單板同時創建一個新的告警收集機,用以在後續過程中接收保存該備用單板發送的告警信息。針對復位單板在復位重啟前上報的告警信息的檢查及標記處理,具體地,可以選擇在判斷預設的時間閾值內是否有接收到與復位單板對應的重啟指示信息之前進行檢查並標記,或者是在預設的時間閾值內接收到與復位單板對應的重啟指示信息之後進行檢查並標記,檢查以及上報標記時機的不同先後並不影響本發明的保護範圍。S203,刪除所述復位單板在復位前上報的告警信息。如果在預設的時間閾值內始終沒有收到與復位單板對應的重啟指示消 息,則說明該復位單板無法再繼續工作,因此與其對應的告警信息也沒有保存的需要,此時將告警信息刪除即可。在確認收到與復位單板對應的重啟指示消息並接收到新的告警信息之後,需要確認該告警信息是否是之前已上報過的告警信息,具體地,首先依據發送該告警信息的單板的CPU地址標識查詢是否存在與該單板關聯的備用單板。若存在備用單板,則說明該備用單板為之前發生復位的單板,需要在該備用單板對應的告警收集機中進行尋找,如果存在匹配的告警信息,那麼將該告警信息添加至發送單板對應的告警收集機中,將告警信息標記為已上報狀態;此外,由於該告警之前已經上報過,因此無需再次上報給控制臺;最後,從備用單板的對應告警收集機中刪除告警信息,並將該接收的告警信息丟棄,以此實現主備單板在復位後針對之前已上報的告警信息的轉移。如果不存在與發送告警信息的單板所關聯的備用單板,或這與該單板關聯的備用單板的對應告警收集機中不存在相應的告警信息,即在該單板對應的告警收集機中查詢是否存在相應的告警信息,如果存在,則丟棄該告警信息;如果不存在,則將該告警信息添加至該單板對應的告警收集機中,上報告警信息,最後標記該告警信息為已上報狀態。為了進一步闡述本發明的技術思想,現結合具體的應用場景,對本發明的技術方案進行說明。為方便起見,以下具體以「冗餘告警信息處理」、「故障告警產生消息的處理」以及「故障告警清除消息的處理」該三個具體實施例分別進行描述。顯然,所描述的實施例僅僅是本發明的一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請保護的範圍。如圖3所示,為本發明具體實施例所提出的冗餘告警處理流程示意圖,包括如下步驟:S301,獲取復位單板信息並標記與復位單板對應的已上報告警信息。全局單板在檢測到對應外圍單板復位後,將與單板對應的告警收集機中 的告警信息進行檢查,將未及時完成標記的告警進行上報狀態的標記處理。本實施例在所有的告警收集機中為每一個告警信息設置了一個上報狀態的標識。該標識默認為0,表示該告警信息尚未上報;為1時則表示該告警信息已經被上報。針對多塊單板的復位的情況,也將對應的告警收集機建立多個同樣的定時器進行監控和檢測處理。此外,全局單板在檢測到復位單板的同時,會同時記錄復位單板的CPU地址信息,依據其CPU信息判斷該外圍單板是否為主備關係的單板。依據是否為主備單板的關係,獲得應該收到復位重啟指示信息的對應外圍單板的單板信息。S302,判斷在預設的時間內是否收到對應外圍單板的復位重啟的指示信息,若收到,轉至S303,若否,轉至S306。在檢測到對應外圍單板復位後,全局單板同時啟動該單板告警收集機冗餘告警定時器,該定時器的時長可根據實際情況中單板復位重啟的時長來確定。需要說明的是,該步驟與前一步驟並不區分先後次序,該實施例中的描述僅為方便起見,執行次序的不同並不影響本發明的保護範圍。S303,判斷復位的單板是否為具有主備關係的單板,若是,轉至S304;若否,轉至S305。如果全局單板在冗餘告警定時器時間到前收到對應外圍單板的復位重啟的指示信息,全局單板依據對應外圍單板是否為主備單板的關係進行不同的處理:針對屬於非主備關係單板,保留原單板告警收集機中的告警信息;針對屬於主備關係的單板,除了保留原單板告警收集機中的告警信息之外,還為重新啟動的備板創建該單板對應的告警收集機。S304,保留原單板告警收集機中的告警信息,並為重新啟動的備板創建該單板對應的告警收集機。S305,保留原單板告警收集機中的告警信息。S306,刪除已標記的告警信息。如果在冗餘告警定時器時間到後,仍然沒有收到對應外圍單板的復位重啟的指示信息,說明對應的單板徹底故障,無法再繼續工作,需要人工進行 單板的維修處理。這樣該單板之前所產生的告警信息也沒有繼續保留的必要,此時全局單板將對應單板的告警收集機中的告警清除,釋放內存空間。同時產生對應的告警清除消息上報給控制臺。以上為本發明具體實施例在檢測到單板復位後所執行的具體流程,由於單板在復位重啟並恢復正常後會重新將自身的告警信息重新上報,因此以下將詳細介紹先前保留的對應單板告警收集機中的告警信息的後續處理流程,如圖4所示,包括以下步驟:S401,接收告警信息並查詢告警源單板信息。全局單板的告警收集機在收到告警代理上報的告警產生消息的同時,通過告警上報的CPU地址標識信息查詢結果來判定是否是存在主備關係的單板。S402,判斷告警源單板是否具有主備關係,若是轉至S403;若否轉至S404。S403,在與告警源單板具有主備關係的對應單板的告警收集機中查詢是否有匹配的告警信息,若有,轉至S405;若否,轉至S404。S405,將該告警信息轉移至與當前告警源單板對應的告警收集機中,並轉至S406。如果在與告警源單板具有主備關係的對應單板的告警收集機中有匹配的告警信息,全局單板將原告警收集機中的告警信息保存到存在主備關係的當前單板的告警收集機中去並標識為已上報,再從原告警收集機中將該告警信息刪除,該告警信息不上報給控制臺,也不產生告警清除消息,直到原告警收集機中不存在任何的告警信息了,全局板將釋放對應的告警收集機的空間。S404,在告警源單板對應的告警收集機中查詢是否有匹配的告警信息,若有,轉至S406;若無,轉至S407。S406,丟棄該告警信息。如果在與告警源單板對應的告警收集機中有匹配的告警信息,則說明該告警信息已經被上報過了,無需再次上報,全局單板將其丟棄處理。S407,保存並上報該告警信息。如果在具有主備關係的對應單板的告警收集機或是源單板的告警收集機中均沒有該告警信息,說明這條告警信息是在單板復位後新產生的,全局單板將該告警信息保存到與源單板對應的告警收集機中去,標識為已上報後上報告警信息給控制臺。與上述實施例類似,全局單板的告警收集機在收到告警代理上報的告警清除消息後,首先在上報消息所標記的告警收集機中進行查找:找到相應的告警信息後清除對應的告警信息;若沒有找到相應的告警信息,在其它的告警收集機中進行查找、刪除,完成後同時上報告警清除消息給控制臺。具體地,故障告警清除消息的處理流程如下:全局單板告警收集機在收到告警代理上報的告警清除消息後,通過告警上報的CPU地址標識信息查詢結果來判定是否是存在主備關係的單板。如果該單板為存在主備關係的單板,在與其存在主備關係的對應單板的告警收集機中進行查找。如果沒有找到對應的告警收集機,或者該單板是不存在主備關係的單板,在當前單板的告警收集機中進行查找(通過告警的細節號、告警源等信息判斷)。如果在該單板的告警收集機中找到對應的告警信息,則將該告警信息作清除處理,同時產生告警清除消息給控制臺。否則不做任何的處理。如果在與該單板存在主備關係的對應單板中找到對應的告警收集機,則進一步在告警收集機中查找對應的告警信息。如果找到,將該告警信息作清除處理,同時產生告警清除消息給控制臺。如果在告警收集機中沒有找到對應的告警信息,則返回當前單板的告警收集機中進行查找,如果找到,將該告警信息作清除處理,同時產生告警清除消息給控制臺,否則不做任何處理。相應地,本發明還提出了一種告警信息處理設備,如圖5所示,包括:判斷模塊510,用於判斷在預設的時間閾值內是否有接收到與復位單板對應的重啟指示信息;處理模塊520,用於在所述判斷模塊510判斷在預設的時間閾值內接收到與復位單板對應的重啟指示信息時,保留所述復位單板在復位前上報的告警信息;在所述判斷模塊510判斷在預設的時間閾值內沒有接收到與復位單板對應的重啟指示信息時,刪除所述復位單板在復位前上報的告警信息。在具體的應用場景中,還包括:標記模塊530,用於檢查所述所述復位單板在復位前上報的告警信息,將未標記為已上報狀態的告警信息標記為已上報狀態。在具體的應用場景中,還包括:獲取模塊540,用於獲取所述復位單板的CPU地址信息,並根據所述CPU地址信息確定是否存在與所述復位單板關聯的備用單板。在具體的應用場景中,所述處理模塊520,還用於:在保留所述復位單板在復位前上報的告警信息之後,為所述備用單板創建對應的告警收集機,用以接收所述備用單板上報的告警信息。在具體的應用場景中,還包括:接口模塊550,用於接收新的告警信息;查詢模塊560,用於在當不存在與發送所述告警信息的單板所關聯的備用單板,或與所述單板關聯的備用單板的對應告警收集機中不存在相應的告警信息時,查詢與所述單板對應的告警收集機中是否存在相應的告警信息;若存在,所述查詢模塊560丟棄所述告警信息;若不存在,所述查詢模塊560將所述告警信息添加至所述單板對應的告警收集機中,並在上報所述告警信息後標記所述告警信息為已上報狀態;轉移模塊570,用於當與所述單板關聯的備用單板的對應告警收集機中存在相應的告警信息時,將所述告警信息添加至所述單板對應的告警收集機中,在將所述告警信息標記為已上報狀態後丟棄所述告警信息,並從所述備用單板的對應告警收集機中刪除所述告警信息。在具體的應用場景中,所述接口模塊550,具體用於:接收所述告警信息,並根據發送所述告警信息的單板的CPU地址標識查詢是否存在與所述單板關聯的備用單板。由此可見,通過應用以上技術方案,針對復位單板在復位前上報的告警信息設置延時處理機制,若在預設的時間內收到復位單板的重啟消息則保留相應的告警信息,從而使對應單板故障告警發生的時間不會因單板復位而發生改變,為故障問題的解決提供了原始數據支撐,避免了操作用戶對故障告警時間的錯誤判斷。通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本發明可以通過硬體實現,也可以藉助軟體加必要的通用硬體平臺的方式來實現。基於這樣的理解,本發明的技術方案可以以軟體產品的形式體現出來,該軟體產品可以存儲在一個非易失性存儲介質(可以是CD-ROM,U盤,移動硬碟等)中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,伺服器,或者網絡設備等)執行本發明各個實施場景所述的方法。本領域技術人員可以理解附圖只是一個優選實施場景的示意圖,附圖中的模塊或流程並不一定是實施本發明所必須的。本領域技術人員可以理解實施場景中的裝置中的模塊可以按照實施場景描述進行分布於實施場景的裝置中,也可以進行相應變化位於不同於本實施場景的一個或多個裝置中。上述實施場景的模塊可以合併為一個模塊,也可以進一步拆分成多個子模塊。上述本發明序號僅僅為了描述,不代表實施場景的優劣。以上公開的僅為本發明的幾個具體實施場景,但是,本發明並非局限於此,任何本領域的技術人員能思之的變化都應落入本發明的保護範圍。