一種提高網絡可靠性的方法及系統的製作方法
2023-06-11 20:21:26 3
專利名稱:一種提高網絡可靠性的方法及系統的製作方法
技術領域:
本發明涉及分組數據轉發技術,尤其涉及一種通過在分組轉發設備上自動監控業務表項提高網絡可靠性的方法及系統。
背景技術:
在一個分組轉發網絡中,每個分組在轉發路徑中的每個轉發節點中獨立查找各種轉發表項,然後根據查找結果進行分組報文的轉發,經過一個個獨立節點的轉發,達到端到端的轉發目的。
在當前IP(Internet Protocol,網際網路協議)分組網絡中,主要支持的轉發業務種類包括IPV4(Internet Protocol Version 4,互連網協議版本4)單播轉發、IPV6(Internet Protocol Version 6,互連網協議版本6)轉發、IPV4組播轉發、MPLS(Multi-Protocol Label Switching,多協議標籤)轉發和VPN(Virtual Private Network,虛擬私有網絡)業務轉發等。
為支持業務的轉發,需要各種協議動態生成的表項支持,如IPV4單播報文的轉發通常需要各種靜態配置,或者動態路由協議IGP(InteriorGateway Protocol,內部網關協議)、BGP(Border Gateway Protocol,邊界網關協議)等生成的FIB(Forwarding Information Base,轉發信息庫)表項,以及二層、三層地址映射的表項,例如ARP(Address Resolution Protocol,地址解析協議)表項等;IPV4組播的轉發,需要有靜態配置的組播表項,或者動態組播協議生成的組播表項MFIB(Multi-Forwarding InformationBase,組播轉發信息庫);IPV6轉發和IPV4基本一致,需要IPV6轉發表項、IPV6 FIB、以及ND(Neighbor Discovery,鄰居發現)表項;MPLS轉發需要LSP(Label Switch Path,標籤交換路徑)轉發表項;而VPN轉發,需要VPN路由表,以及路由標籤映射表項等。
在上述分組轉發設備中,為各種業務轉發所使用的靜態配置或者各種協議動態生成的表項,是各種業務正常轉發的基礎。當由於設備配置錯誤、設備故障、或者協議錯誤導致轉發表項錯誤時,將導致上層業務不能正常轉發。
隨著IP/MPLS技術的普及以及使用範圍的擴大,IP分組轉發設備上承載越來越多的業務,不僅包括IP Internet業務,企業互連業務,而且承載電信語音、視頻、IMS、大客戶專線等各種高可靠性業務。在現有技術中,當出現業務故障後,需要人工進行業務故障原因的定位,在大量的網絡設備上,檢索各種表項,從而定位故障業務所依賴的所有表項是否存在或者有故障。當定位到故障後,再採取對應的操作,例如修改配置、部分或者全部重啟協議、重啟單板、重啟設備等方法來恢復表項,從而達到恢復業務的目的。因此,現有技術依賴於人工解決,難度大,效率低,而且成本高,並且網絡故障不能很快恢復,進而降低了網絡的可靠性。
發明內容
本發明要解決的問題是提供一種提高網絡可靠性的方法及系統,以解決現有技術網絡的可靠性低的缺陷。
為了解決上述問題,本發明提供了一種提高網絡可靠性的方法,包括以下步驟A、監測分組轉發設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現故障,轉步驟C;B、判斷該表項是否符合預先設置的範圍,如果是則正常工作,否則,該表項出現故障,轉步驟C;C、對分組轉發設備進行恢復操作和/或發出設備告警信息。
步驟A通過定時輪循被監控表項或被監控表項自動上報方式實現。
步驟A當使用定時輪循被監控表項時,進一步包括A1、分組轉發設備按預先設置的時間向所監控的表項發送查找請求;A2、所述表項向分組轉發設備發送表項狀態、和/或表項參數。
步驟A當被監控表項自動上報時,所述被監控表項實時或定時向分組轉發設備發送該表項狀態、和/或表項參數。
所述設備告警信息包括出現故障表項的標識。
步驟C根據出現故障表項的標識進行恢復操作。
所述恢復操作包括協議復位、業務單板復位或分組轉發設備復位。
所述被監控表項應用於一臺或者多臺分組轉發設備上的一種或者多種轉發。
所述被監控的表項是一個端到端的業務轉發所需要的各個分組轉發設備上的多個表項;或是一個或者多個分組轉發設備上的一個或者多個不相關的表項。
本發明還提供了一種提高網絡可靠性的系統,包括多個分組轉發設備,在一個或多個分組轉發設備中進一步包括監控單元、表項預設單元和自動恢復單元;所述表項預設單元,用於存儲預先設置的表項參數;所述監控單元,用於定時或實時檢測表項參數,並通過與預先設置的表項參數比較,確定表項狀態;所述自動恢復單元,用於根據表項狀態觸發對應的恢復操作和/或發出告警信息。
與現有技術相比,本發明具有以下優點本發明在設備轉發或者處理時依賴的表項錯誤情況下,通過啟用自動監控功能,對業務轉發依賴的各種表項進行自動監控,快速定位網絡故障,加快網絡故障恢復,從而提高網絡的可靠性。
圖1是本發明提高分組轉發網絡可靠性的方法流程圖;圖2是本發明一個具體實施例結構圖;圖3是本發明另一個具體實施例結構圖。
具體實施例方式
本發明一種提高網絡可靠性的方法如圖1所示,包括以下步驟
步驟s101,監測分組轉發設備使用的表項是否存在,如果存在,則轉步驟s102,否則,該表項出現故障,轉步驟s103。其中,監測可以通過定時輪循被監控表項或被監控表項自動上報方式實現,當使用定時輪循被監控表項時,分組轉發設備按預先設置的時間向所監控的表項發送查找請求,然後,表項向分組轉發設備發送表項狀態、和/或表項參數,其中表項的狀態為存在或不存在,表項參數可以為路由地址等;當被監控表項自動上報時,被監控表項實時或定時向分組轉發設備發送該表項狀態、和/或表項參數。
步驟s102,判斷該表項是否符合預先設置的範圍,如果是則正常工作,否則,該表項出現故障,分組轉發設備發出設備告警信息,該設備告警信息中包括出現故障表項的標識,並轉步驟s103。其中,所述表項的範圍是連續的,如0.0.0.1到0.0.0.24;或是離散的,如0.0.0.1、0.0.0.5、0.0.0.9等。另外,該表項的範圍可以根據不同表項的屬性及應用特點預先設定,並存儲於分組轉發設備中。
步驟s103,對分組轉發設備進行恢復操作,並可以同時或單獨發出告警信息。根據出現故障表項的標識進行恢復操作,所述恢復操作包括協議復位、業務單板復位或分組轉發設備復位。例如,可以根據不同表項發生故障分別採取重新配置設備、重新啟動相關協議、重新啟動相關業務單板、重新啟動相關設備等方式排除故障。
其中,被監控表項可以是應用於一臺或者多臺分組轉發設備上的一種或者多種轉發表項;例如FIB、MFIB、路由表、MPLS表項、ARP表項、ND表項、ACL(Access Control List,訪問控制列表)等。被監控的表項可以是一個端到端的業務轉發所需要的各個分組轉發設備上的多個表項,也可以是一個或者多個分組轉發設備上的一個或者多個不相關的表項。
下面結合具體實施例對本發明進行詳細說明一個具體實施例如圖2所示,包括骨幹網和城域網,骨幹網中包括網絡路由器NR1和NR2,城域網中核心層包括服務路由器SR1和SR2,匯聚層包括用戶路由器CR1、CR2和CR3,其中CR1、CR2、CR3通過雙歸連接到SR1、SR2上,SR1、SR2再通過雙歸連接到骨幹網絡。其中SR1、SR2分別具有20萬的全Internet路由,CR1、CR2、CR3隻有本城域網內的路由,其他的業務流量則通過預設路由0.0.0.0/0路由進行引導。在CR1、CR2、CR3上,預設路由是一條非常重要的路由,Internet流量的80%都通過預設路由轉發,如果預設路由丟失,或者預設路由計算錯誤都會造成業務的大量丟失。因此,為了提高可靠性,可以在CR1上對0.0.0.0/0路由進行定時監控,而且下一跳必須是SR1或者SR2,通過5秒一次的定時器查詢,如果查詢不到0.0.0.0/0預設路由,或者此預設路由下一跳不是SR1或者SR2,則立即將IGP協議重啟,在IGP重啟後,丟失的IGP可以再重新恢復,這樣可以大大提高CR1路由器對業務支持的可靠性。
另一實施例如圖3所示,路由器組網情況和圖2相同,其中新增了一個大客戶接入路由器CE1,該大客戶路由器的主要接入地址在61.148.1.0/24範圍之內。由於該大客戶路由器CE1是整個城域網絡中最重要的客戶之一,業務流量是在整個城域網中都非常重要,對於返回大客戶流量所依賴的路由在整個網絡中都非常重要,所以需要在整個城域網中的所有路由器上都對該大客戶路由進行監控。例如,通過5秒一次的定時輪循,在SR1、SR2、CR1、CR2、CR3等所有路由器上對61.148.1.0/24路由進行監控,如果一旦發現路由丟失,則立即觸發告警,通知網絡維護人員儘快處理和恢復業務,進而可以大大提高大客戶業務的可靠性。在該實施例中表項監控功能可以在單個分組轉發設備中實現,也可以通過在網絡中增加一個具有該監控功能的設備實現。
本發明一種提高網絡可靠性的系統,該系統中的一個或多個分組轉發設備具有表項監控功能。該些分組轉發設備包括監控單元、表項預設單元和自動恢復單元,表項預設單元存儲預先設置的表項參數;監控單元定時或實時檢測表項參數,並通過與預先設置的表項參數比較,確定表項狀態;自動恢復單元根據表項狀態觸發對應的恢復操作。一旦分組轉發設備由於某些原因導致業務轉發依賴的表項發生錯誤後,通過定時監控系統很快發現故障,進行告警或自動對故障進行處理,由於在告警中可以明確的指出哪個表項發生了故障,所以故障的定位和恢復速度可以大大提高,另外,可以根據原先設定好的動作對故障自動進行處理,例如重新啟動協議、重新啟動單板、重新啟動設備等。
以上所述僅是本發明的優選實施方式,應當指出,對於本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護範圍。
權利要求
1.一種提高網絡可靠性的方法,其特徵在於,包括以下步驟A、監測分組轉發設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現故障,轉步驟C;B、判斷該表項是否符合預先設置的範圍,如果是則正常工作,否則,該表項出現故障,轉步驟C;C、對分組轉發設備進行恢復操作和/或發出設備告警信息。
2.如權利要求1所述提高網絡可靠性的方法,其特徵在於,步驟A通過定時輪循被監控表項或被監控表項自動上報方式實現。
3.如權利要求2所述提高網絡可靠性的方法,其特徵在於,步驟A當使用定時輪循被監控表項時,進一步包括A1、分組轉發設備按預先設置的時間向所監控的表項發送查找請求;A2、所述表項向分組轉發設備發送表項狀態、和/或表項參數。
4.如權利要求2所述提高網絡可靠性的方法,其特徵在於,步驟A當被監控表項自動上報時,所述被監控表項實時或定時向分組轉發設備發送該表項狀態、和/或表項參數。
5.如權利要求1所述提高網絡可靠性的方法,其特徵在於,所述設備告警信息包括出現故障表項的標識。
6.如權利要求5所述提高網絡可靠性的方法,其特徵在於,步驟C根據出現故障表項的標識進行恢復操作。
7.如權利要求6所述提高網絡可靠性的方法,其特徵在於,所述恢復操作包括協議復位、業務單板復位或分組轉發設備復位。
8.如權利要求1至7中任一項所述提高網絡可靠性的方法,其特徵在於,所述被監控表項應用於一臺或者多臺分組轉發設備上的一種或者多種轉發。
9.如權利要求1至7中任一項所述提高網絡可靠性的方法,其特徵在於,所述被監控的表項是一個端到端的業務轉發所需要的各個分組轉發設備上的多個表項;或是一個或者多個分組轉發設備上的一個或者多個不相關的表項。
10.一種提高網絡可靠性的系統,包括多個分組轉發設備,其特徵在於,在一個或多個分組轉發設備中進一步包括監控單元、表項預設單元和自動恢復單元;所述表項預設單元,用於存儲預先設置的表項參數;所述監控單元,用於定時或實時檢測表項參數,並通過與預先設置的表項參數比較,確定表項狀態;所述自動恢復單元,用於根據表項狀態觸發對應的恢復操作和/或發出告警信息。
全文摘要
本發明提供了一種提高網絡可靠性的方法,包括以下步驟A.監測分組轉發設備使用的表項是否存在,如果存在,則轉步驟B,否則,該表項出現故障,轉步驟C;B.判斷該表項是否符合預先設置的範圍,如果是,則正常工作,否則,該表項出現故障,轉步驟C;C.對分組轉發設備進行恢復操作。本發明還提供了一種提高網絡可靠性的系統。本發明在分組設備轉發或者處理時所依賴表項錯誤情況下,通過啟用自動監控功能,對業務轉發依賴的各種表項進行自動監控,快速定位網絡故障,加快網絡故障恢復,從而提高網絡的可靠性。
文檔編號H04L12/56GK101047566SQ200610076458
公開日2007年10月3日 申請日期2006年4月26日 優先權日2006年4月26日
發明者李鑑 申請人:華為技術有限公司