新四季網

一種irf故障處理方法和irf故障檢測系統的製作方法

2023-05-10 21:14:01

專利名稱:一種irf故障處理方法和irf故障檢測系統的製作方法
技術領域:
本發明涉及通信技術領域,特別涉及一種IRF故障處理方法和IRF故障檢測系統。
背景技術:
IRFdntelligent Resilient Framework,智能彈性架構)是將多臺設備通過 IRF 鏈路連接在一起,進行必要的配置後,虛擬化成一臺設備,一般稱為IRF設備,使用這種虛 擬化技術可以實現多臺設備的協同工作、統一管理和不間斷維護。IRF設備中所有的單臺設備稱為成員設備,成員設備按照功能不同,分為兩種角 色(1)主成員設備負責管理整個IRF設備中的成員設備,由角色選舉產生,一個IRF設備中同一時刻 只能有一臺主成員設備。(2)從成員設備隸屬於主成員設備的成員設備,作為主成員設備的備份設備運行,由角色選舉產 生,IRF設備中除了主成員設備,其它設備都是從成員設備。在實際應用中,根據當前的網絡環境以及設備在網絡中擔當的角色,設備支持兩 種運行模式(1)獨立運行模式處於該模式下的設備只能單機運行,不能與別的設備形成IRF設備。(2) IRF 模式處於該模式下的設備可以與別的設備互連形成IRF設備。需要說明的是,相對於獨立運行模式下的設備,IRF設備主要具有以下優點(1)簡化管理IRF設備形成之後,用戶通過任意成員設備的任意埠都可以登錄IRF設備的系 統,對IRF設備內所有成員設備進行統一管理。⑵高可靠性IRF設備的高可靠性體現在多個方面,例如IRF設備由多臺成員設備組成,成員 設備的角色有主成員設備和從成員設備之分,主成員設備負責IRF設備的運行、管理和維 護,從成員設備在作為備份的同時也可以處理業務。一旦主成員設備故障,系統會迅速在從 成員設備中自動選舉新的主成員設備,以保證業務不中斷;此外,IRF設備支持跨成員設備 的聚合功能,多條鏈路之間可以互為備份也可以進行負載分擔,從而進一步提高了 IRF設 備的可靠性。(3)強大的網絡擴展能力通過增加成員設備,可以輕鬆自如的擴展IRF設備的埠數、帶寬。因為各成員設 備都有CPU (Central Processing Unit,中央處理單元),能夠獨立處理協議報文、進行報文 轉發,所以IRF設備還能夠輕鬆自如的擴展處理能力。
在實際應用中,IRF設備中使用成員編號來標識和管理成員設備,IRF設備中所有 成員設備的編號都是唯一的。比如,IRF設備中接口的編號會加入成員編號信息設備在獨立運行模式下,某個 接口的編號為GigabitEthernet3/0/l,當該設備加入IRF後,如果成員編號為2,則該接口 的編號將變為 GigabitEthernet2/3/0/l。以兩臺設備為例,當兩臺設備工作在IRF模式下,通過IRF鏈路相連,進行必要的 配置,會合併成一臺IRF設備,這個過程稱為IRF合併,該過程的流程示意圖如圖1所示。一個IRF設備形成後,由於IRF鏈路故障,導致IRF設備中兩成員設備物理上不連 通,IRF設備會分裂成兩臺工作在IRF模式下的獨立設備,分裂後的兩個獨立的設備都是主 成員設備,這個過程稱為IRF分裂,該過程的流程示意圖如圖2所示。IRF鏈路故障會導致一個IRF設備變成兩臺工作在IRF模式下的獨立設備,這兩臺 工作在IRF模式下的獨立設備擁有相同的IP位址等三層配置,會引起地址衝突,導致故障 在網絡中擴大。為了提高系統的可用性,當IRF設備分裂時我們就需要一種機制,能夠檢測 出這種由於IRF分裂而出現的地址衝突,並進行相應的處理,儘量降低IRF分裂對業務的影 響。目前,具體有以下三種方法可以用來檢測IRF分裂方法一、通過LACP(LinkAggregation Control Protocol,鏈路聚合控制協議)來 檢測IRF分裂。LACP檢測IRF分裂方法的示意圖如圖3所示,IRF設備和設備C進行跨成員設備 的動態聚合,IRF設備中設備A的成員編號為1,是主成員設備,設備B的成員編號為2,是 從成員設備。LACP檢測IRF分裂方法通過在原有LACP協議報文中添加擴展欄位,在擴展欄位中 填充主成員設備的成員編號,當檢測到成員編號衝突時,就認為IRF分裂。IRF設備正常工作的情況下,設備A和設備B發送的LACP報文中,擴展欄位中填 充的主成員設備成員編號都是1,沒有衝突。當IRF鏈路斷開時,IRF分裂,設備A和設備B 就是兩臺獨立運行在IRF模式下的設備,都是主成員設備,這時設備A發送的LACP報文中 擴展欄位填充的主成員設備成員編號是1,設備B發送的LACP報文中擴展欄位填充的主成 員設備成員編號是2,這時就會檢測到衝突,即IRF分裂。方法二、通過BFD(BidirectionalForwarding Detection,雙向轉發檢測)來檢測 IRF分裂。BFD檢測IRF分裂方法的示意圖如圖4所示,在IRF設備配置BFD檢測,在成員設 備A和成員設備B之間增加一條BFD檢測鏈路,當IRF設備正常工作時,成員設備之間BFD 檢測鏈路是無法建立起會話的,當IRF分裂後,設備A和設備B就是兩臺獨立運行在IRF模 式下的設備,都是主成員設備,BFD鏈路能建立起會話,BFD鏈路建立起會話表示檢測到衝 突,即IRF分裂。方法三、通過免費ARP (Address Resolution Protocol,地址解析協議)來檢測 IRF分裂。免費ARP檢測IRF分裂方法的示意圖如圖5所示,在成員設備A和成員設備B之 間增加一條ARP檢測鏈路,對免費ARP報文進行擴展,在擴展欄位中填充主成員設備的成員
7編號,方法與LACP檢測IRF分裂相似。當IRF分裂後,設備A和設備B就是兩臺獨立運行在IRF模式下的設備,都是主成 員設備,會互相發送免費ARP報文,設備A發送的免費ARP報文中擴展欄位填充的主成員設 備成員編號是1,設備B發送的免費ARP報文中擴展欄位填充的主成員設備成員編號是2, 這時就會檢測到衝突,即IRF分裂。採用以上三種方法檢測到IRF分離後,會讓原IRF設備中成員編號最小的設備繼 續正常工作,轉發業務流量,其它成員設備處于禁用狀態,不再轉發業務流量。在實現本發明的過程中,發明人發現現有技術至少存在以下問題在現有的技術方案中,IRF分裂處理都是讓IRF設備中成員編號最小的設備繼續 正常工作,轉發業務流量,其他成員設備處于禁用狀態,不再轉發業務流量,如果成員編號 小的設備還存在其他故障時,會影響轉發業務。如圖6所示的應用場景中,IRF設備與設備C之間通過鏈路3和鏈路4進行跨設 備聚合相連,IRF設備與設備D之間通過鏈路1和鏈路2進行跨設備聚合相連,為了方便觀 察流量轉發,IRF分裂檢測鏈路省略沒有畫出來,設備A是主成員設備,成員編號是1,設備 B是從成員設備,成員編號是2,當鏈路1發生故障後,設備C和D之間的流量都會通過設備 B進行轉發,如果IRF鏈路也發生故障,IRF衝突檢測機制檢測到IRF分離,這時設備B會被 強制處于禁用狀態,設備A繼續正常工作,設備C和設備D之間的流量都無法轉發。

發明內容
本發明提供一種IRF故障處理方法和IRF故障檢測系統,用以解決現有的在IRF 設備分裂後,按照成員編號確定繼續正常工作的IRF成員設備的處理策略中,無法識別被 確定繼續正常工作的IRF成員設備的其他鏈路故障的問題。為達到上述目的,本發明一方面提供了一種基於智能彈性架構IRF故障處理方 法,應用於包括IRF設備和故障檢測設備的系統中,所述IRF設備由兩個IRF成員設備組 成,各所述IRF成員設備之間通過IRF鏈路相連接,所述故障檢測設備與所述IRF設備動態 聚合,並分別與所述IRF設備中的各IRF成員設備建立鏈路聚合控制協議LACP檢測鏈路, 所述方法至少包括以下步驟所述故障檢測設備通過所述LACP檢測鏈路接收各所述IRF成員設備發送的LACP 報文,所述LACP報文包含IRF成員設備對應的主成員設備編號以及主成員設備優先級參 數;所述故障檢測設備根據接收的所述LACP報文判斷所述IRF設備發生分裂時,比較 兩個所述IRF成員設備對應的主成員設備優先級參數;所述故障檢測設備確定兩個所述IRF成員設備對應的主成員設備優先級參數不 同時,向對應較小的主成員設備優先級參數的IRF成員設備發送禁用指示,以使對應較大 的主成員設備優先級參數的IRF成員設備繼續進行報文轉發。優選的,所述故障檢測設備通過所述LACP檢測鏈路接收各所述IRF成員設備發送 的LACP報文之前,所述方法還包括;設置各所述IRF成員設備優先級參數計算策略和被檢測鏈路,其中,所述被檢測 鏈路具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;
各所述IRF成員設備分別檢測所設置的被檢測鏈路是否發生故障;當所述IRF成員設備檢測到被檢測鏈路發生故障時,所述IRF成員設備根據設置 的優先級參數計算策略計算優先級參數。優選的,所述方法還包括所述故障檢測設備確定兩個所述IRF成員設備對應的主成員設備優先級參數相 同時,比較各IRF成員設備所對應的主成員設備編號,並向對應較大的主成員設備編號的 IRF成員設備發送禁用指示,以使對應較小的主成員設備編號的IRF成員設備繼續進行報 文轉發。另一方面,本發明還提供了一種IRF故障檢測系統,包括IRF設備和故障檢測設備 的系統中,所述IRF設備由兩個IRF成員設備組成,各所述IRF成員設備之間通過IRF鏈路 相連接,所述故障檢測設備與所述IRF設備動態聚合,並分別與所述IRF設備中的各IRF成 員設備建立LACP檢測鏈路,包括所述故障檢測設備包括第一接收模塊、第一處理模塊以及第一發送模塊;所述第一接收模塊,用於通過所述LACP檢測鏈路接收各所述IRF成員設備發送的 LACP報文,其中,所述LACP報文包含IRF設備對應的主成員設備編號以及主成員設備優先 級參數;所述第一處理模塊,用於根據接收的所述LACP報文判斷兩個所述IRF設備是否發 生分裂,若判斷所述IRF設備發生分裂時,則比較兩個所述IRF成員設備對應的主成員設備 優先級參數,若比較結果為不同,則通知所述第一發送模塊向對應較小的主成員設備優先 級參數的IRF成員設備發送禁用指示;所述第一發送模塊,用於根據所述第一處理模塊的通知,向對應較小的主成員設 備優先級參數的IRF成員設備發送禁用指示,以使所對應較大的主成員設備優先級參數的 IRF成員設備繼續進行報文轉發。優選的,所述IRF成員設備包括第二發送模塊、第二接收模塊以及第二處理模塊;所述第二發送模塊,用於通過所述LACP檢測鏈路向所述故障檢測設備發送所述 LACP報文;所述第二接收模塊,用於接收所述禁用指示;所述第二處理模塊,用於根據接收的所述禁用指示停止進行報文轉發。優選的,所述IRF成員設備,進一步包括第二設置模塊,用於分別設置優先級參數計算策略和被檢測鏈路,其中,所述被檢 測鏈路具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;第二檢測模塊,與所述第二設置模塊相連接,用於檢測所述第二設置模塊所設置 的被檢測鏈路是否發生故障;第二計算模塊,與所述第二設置模塊和所述第二檢測模塊相連接,用於在所述第 二檢測模塊檢測到被檢測鏈路發生故障時,根據所述第二設置模塊所設置的優先級參數計 算策略計算自身的優先級參數。優選的,所述第一處理模塊,還用於在比較兩個所述IRF成員設備所對應的主成員設備優先級參數相同時,比較兩個 所述IRF成員設備所對應的主成員設備編號,並通知所述第一發送模塊向對應較大主成員
9設備編號的IRF成員設備發送禁用指示。另一方面,本發明還提供了一種IRF故障處理方法,應用於包含IRF設備的系統 中,所述IRF設備由兩個IRF成員設備組成,各所述IRF成員設備之間通過IRF鏈路相連 接,且各所述IRF成員設備之間建立雙向轉發檢測BFD檢測鏈路或地址解析協議ARP檢測 鏈路,所述方法至少包括以下步驟IRF成員設備通過所述BFD檢測鏈路或ARP檢測鏈路接收另一個IRF成員設備發 送的BFD報文或免費ARP報文,所述BFD報文或免費ARP報文包含另一個IRF成員設備對 應的主成員設備編號以及主成員設備優先級參數;所述IRF成員設備根據接收的所述BFD報文或免費ARP報文判斷兩個所述IRF設 備發生分裂時,判斷自身對應的主成員設備優先級參數是否小於所述另一個IRF成員設備 對應的主成員設備優先級參數;如果判斷結果為小於,所述IRF成員設備終止報文轉發,以使所述另一個IRF成員 設備繼續進行報文轉發。優選的,所述IRF成員設備通過所述BFD檢測鏈路或ARP檢測鏈路接收另一個IRF 成員設備發送的BFD報文或免費ARP報文,還包括;設置各所述IRF成員設備優先級參數計算策略和被檢測鏈路,其中,所述被檢測 鏈路具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;各所述IRF成員設備分別檢測所設置的被檢測鏈路是否發生故障;當所述IRF成員設備檢測到被檢測鏈路發生故障時,所述IRF成員設備根據設置 的優先級參數計算策略計算優先級參數。優選的,所述IRF成員設備根據接收的所述BFD報文或免費ARP報文判斷兩個所 述IRF設備發生分裂時,判斷自身對應的主成員設備優先級參數是否小於所述另一個IRF 成員設備對應的主成員設備優先級參數,具體為當所述IRF成員設備通過所述BFD檢測鏈路與另一個IRF成員設備建立BFD會 話,並接收到另一個IRF成員設備發送的包含自身對應的主成員設備優先級參數的BFD報 文時,所述IRF成員設備判斷自身對應的主成員設備優先級參數是否小於所述BFD報文中 攜帶的主成員設備優先級參數;或,當所述IRF成員設備接收到另一個IRF成員設備發送的包含自身對應的主成員設 備優先級參數的免費ARP報文,且根據所述免費ARP報文判斷所述IRF設備發生分裂時,所 述IRF成員設備判斷自身對應的主成員設備優先級參數是否小於所述免費ARP報文中攜帶 的主成員設備優先級參數。優選的,所述另一個IRF成員設備所發送的包含自身對應的主成員設備編號以及 主成員設備優先級參數的BFD報文中,還包括優先級參數標識位,如果所述BFD報文中的優先級參數標識位標識所述BFD報文中攜帶優先級參數信 息,所述IRF成員設備判斷自身對應的主成員設備優先級參數是否小於所述BFD報文中攜 帶的主成員設備優先級參數;如果所述BFD報文中的優先級參數標識位標識所述BFD報文中沒有攜帶優先級參 數信息,所述IRF成員設備判斷自身對應的主成員設備編號是否小於另一個IRF成員設備 對應的主成員設備編號,如果小於,所述IRF成員設備繼續進行報文轉發,如果不小於,所述IRF成員設備終止報文轉發,以使對應較小的主成員設備編號的IRF成員設備繼續進行 報文轉發。優選的,所述方法還包括如果判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數大於另一 個IRF成員設備對應的主成員設備優先級參數,所述IRF成員設備繼續進行報文轉發;如果判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數等於另一 個IRF成員設備對應的主成員設備優先級參數,所述IRF成員設備判斷自身對應的主成員 設備編號是否小於另一個IRF成員設備對應的主成員設備編號,如果小於,所述IRF成員設 備繼續進行報文轉發,如果不小於,所述IRF成員設備終止報文轉發,以使對應較小的主成 員設備編號的IRF成員設備繼續進行報文轉發。另一方面,本發明還提供了一種IRF故障檢測系統中,包括由兩個IRF成員設備所 組成的IRF設備,兩個IRF設備之間通過IRF鏈路相連接,且兩個所述IRF成員設備之間建 立BFD檢測鏈路或ARP檢測鏈路,包括所述IRF成員設備包括設置模塊、接收模塊、判斷模塊和處理模塊所述設置模塊,用於設置IRF故障檢測策略;所述接收模塊,與所述設置模塊相連接,用於根據所述設置模塊所設置的IRF故 障檢測策略,通過所述BFD鏈路接收另一個IRF成員設備發送的BFD報文,並在所述IRF設 備發生分裂時,與所述另一個IRF成員設備建立BFD會話,或通過ARP鏈路接收另一個IRF 成員設備發送的免費ARP報文,所述BFD報文或免費ARP報文包含另一個IRF成員設備對 應的主成員設備編號以及主成員設備優先級參數;所述判斷模塊,與所述接收模塊相連接,用於在所述接收模塊與所述另一個IRF 成員設備建立BFD會話,或所述接收模塊所接收的免費ARP報文表示所述IRF設備發生分 裂時,判斷所述IRF成員設備自身對應的主成員設備優先級參數是否小於所述接收模塊所 接收的所述BFD報文或免費ARP報文所攜帶的所述另一個IRF成員設備對應的主成員設備 優先級參數;所述處理模塊,與所述判斷模塊相連接,用於在所述判斷模塊的判斷結果為小於 時,終止所述IRF成員設備進行報文轉發,以使所述另一個IRF成員設備繼續進行報文轉發。優選的,所述IRF成員設備,還包括檢測模塊、計算模塊和發送模塊所述設置模塊,還用於設置優先級參數計算策略和被檢測鏈路,其中,所述被檢測 鏈路具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;所述檢測模塊,與所述設置模塊相連接,用於檢測所述設置模塊所設置的被檢測 鏈路是否發生故障;所述計算模塊,與所述設置模塊和所述檢測模塊相連接,用於在所述檢測模塊檢 測到被檢測鏈路發生故障時,根據所述設置模塊所設置的優先級參數計算策略計算自身的 優先級參數;所述發送模塊,與所述設置模塊和所述計算模塊相連接,用於根據所述設置模塊 所設置的IRF故障檢測策略,通過所述BFD檢測鏈路或ARP檢測鏈路向另一個IRF成員設 備發送BFD報文或免費ARP報文,所述BFD報文或免費ARP報文包含所述IRF成員設備對應的主成員設備編號以及主成員設備優先級參數。優選的,所述處理模塊,還用於在所述判斷模塊的判斷結果為所述IRF成員設備自身對應的主成員設備優先級 參數大於另一個IRF成員設備對應的主成員設備優先級參數時,保持所述IRF成員設備繼 續進行報文轉發;或,在所述判斷模塊的判斷結果為所述IRF成員設備自身對應的主成員設備優先級 參數等於另一個IRF成員設備對應的主成員設備優先級參數時,通知所述判斷模塊判斷所 述IRF成員設備對應的主成員設備編號是否小於另一個IRF成員設備對應的主成員設備編 號,如果小於,保持所述IRF成員設備繼續進行報文轉發,如果不小於,終止所述IRF成員設 備進行報文轉發,以使對應較小的主成員設備編號的IRF成員設備繼續進行報文轉發。與現有技術相比,本發明具有以下優點通過應用本發明的技術方案,分別給IRF設備中的每個IRF成員設備設置優先級 參數,監控各自的鏈路狀態,並根據被監控鏈路的狀態調整優先級參數,在各IRF成員設備 所發送的IRF故障檢測報文中攜帶各自所對應的主成員設備優先級參數,從而,在IRF設備 分裂時,可以根據相應的優先級參數,在分裂後的各IRF成員設備中,選擇鏈路狀態更優, 故障更少的設備繼續工作,而禁用其它設備,在確保系統中不會因為IRF設備分裂而產生 衝突的前提下,進一步保證其他鏈路的通信業務,提高系統的可靠性。


圖1為現有技術中IRF設備合併的示意圖;圖2為現有技術中IRF設備分裂的示意圖;圖3為現有技術中一種基於LACP報文檢測IRF故障的方法的應用場景的示意圖;圖4為現有技術中一種基於BFD報文檢測IRF故障的方法的應用場景的示意圖;圖5為現有技術中一種基於免費ARP報文檢測IRF故障的方法的應用場景的示意 圖;圖6為現有技術中一種IRF故障檢測的應用場景的示意7為本發明所提出的一種基於LACP故障檢測策略的IRF故障處理方法的流程 示意圖;圖8為本發明所提出的一種基於BFD或ARP故障檢測策略的IRF故障處理方法的 流程示意圖;圖9為本發明所提出的一種BFD報文的結構示意圖;圖10為本發明所提出的一種IRF故障檢測的應用場景的示意圖;圖11為本發明所提出的一種基於LACP故障檢測策略的IRF故障檢測系統的結構 示意圖;圖12為本發明所提出的一種基於BFD或ARP故障檢測策略的IRF故障檢測系統 的結構示意圖。
具體實施例方式如背景技術所述,現有的IRF故障處理策略中,在IRF設備分裂後,按照成員編號
12備,但這樣的處理策略無法確定IRF成員設備的其他鏈路 故障,因此,有可能會出現選擇具有其他鏈路故障的IRF成員設備繼續工作,而禁用了其他 鏈路狀態正常的IRF成員設備的情況,從而,導致網絡中的正常通信無法實現。本發明正是基於此問題提出了一種IRF故障處理方法,根據具體的檢測策略不 同,本發明所提出的IRF故障處理方法分為以下兩種情況情況一、基於LACP故障檢測策略的IRF故障處理方法該方法應用於包括IRF設備和故障檢測設備的系統中,IRF設備由兩個IRF成員 設備組成,各IRF成員設備之間通過IRF鏈路相連接,故障檢測設備與IRF設備動態聚合, 並分別與IRF設備中的各IRF成員設備建立LACP檢測鏈路。如圖7所示,為本發明提出的一種基於LACP故障檢測策略的IRF故障處理方法的 流程示意圖,具體包括以下步驟步驟S701、故障檢測設備通過LACP檢測鏈路接收各IRF成員設備發送的LACP報文。其中,LACP報文包含IRF成員設備對應的主成員設備編號以及主成員設備優先級參數。在本步驟實現之前,首先需要在各IRF成員設備上設置優先級參數的處理機制, 具體處理過程的說明如下(1)設置各IRF成員設備優先級參數計算策略和被檢測鏈路。其中,被檢測鏈路具體為IRF成員設備上除IRF鏈路外的鏈路。在實際的應用場景中,各IRF成員設備中需要分別初始值相同的優先級參數,這 樣保證在初始狀態下IRF設備中的各IRF成員設備之間的優先級平等。同時,在各IRF成員設備中,分別設置除IRF鏈路外的一個或多個鏈路為被檢測鏈 路,這些鏈路可以是該IRF設備中除IRF鏈路外的全部鏈路,這樣可以對該IRF成員設備的 鏈路狀態進行全面監控,也可以只是選擇該IRF成員設備的一條或多條關鍵鏈路,這些鏈 路在網絡系統的通信中起到關鍵作用,而即使發生故障也不會影響網絡系統的正常通信的 其他的非關鍵鏈路則不作為被檢測鏈路,這樣的處理可以縮小檢測的鏈路範圍,將檢測資 源應用於更為重要的關鍵鏈路。(2)各IRF成員設備分別檢測所設置的被檢測鏈路是否發生故障,當IRF成員設備 檢測到被檢測鏈路發生故障時,IRF成員設備根據設置的優先級參數計算策略計算優先級參數。在檢測過程中,如果一個或多個被檢測鏈路發生故障,則相應的IRF成員設備調 整自身的優先級的參數,例如可以根據發生故障的被檢測鏈路的數量或故障比例或是否 發生故障,將自身的優先級參數減少相應的數值。經過上述處理,各IRF成員設備自身都保持了優先級參數的記錄,而為了本發明 所提出的技術方案的實現,在上述的步驟S701中,相應的LACP報文都需要攜帶發送該故障 檢測報文的IRF成員設備所對應的主成員設備優先級參數,為了 LACP報文的及時發送,各 IRF成員設備需要及時識別自身所對應的主成員設備,並獲取相應的優先級參數,這樣的識 別主成員設備和獲取主成員設備優先級參數的機制可以是(1)實時識別和獲取,這樣可以保證信息獲取的時效性。
13
(2)周期性識別和獲取,但是周期的設置應該是一個比較小的時間區間,以保證信 息獲取的及時;(3)事件觸發識別和獲取,例如當發生IRF設備分裂時,成為主成員設備的IRF成 員設備主動向其他IRF成員設備發送自身成為主成員設備的通知消息,並通知相應的優先 級參數。在實際的應用場景中,具體應用上述的哪種方式進行主成員設備識別和相應優先 級參數的獲取並不會影響本發明的保護範圍。在實際應用中,當系統中與IRF設備動態聚合的故障檢測設備接收到的兩個IRF 成員設備所發送的LACP報文中攜帶的主成員設備編號不同,即檢測到主成員設備衝突,判 斷IRF設備分裂。此時,執行步驟S702。步驟S702、故障檢測設備比較兩個IRF成員設備對應的主成員設備優先級參數。當故障檢測設備確定兩個IRF成員設備對應的主成員設備優先級參數不同時,執 行步驟S703 ;當故障檢測設備確定兩個IRF成員設備對應的主成員設備優先級參數相同時,執 行步驟S704。步驟S703、故障檢測設備向對應較小的主成員設備優先級參數的IRF成員設備發 送禁用指示,以使對應較大的主成員設備優先級參數的IRF成員設備繼續進行報文轉發。通過本步驟,可以在IRF設備分裂後,使對應較小的主成員設備優先級參數的IRF 成員設備終止報文轉發,而選擇對應較大的主成員設備優先級參數,即被檢測鏈路的狀態 最好的IRF成員設備繼續進行報文轉發,從而,在避免系統中出現設備配置衝突的前提下, 使鏈路狀態更好的IRF成員設備繼續進行報文轉發工作。步驟S704、故障檢測設備比較各IRF成員設備所對應的主成員設備編號,並向對 應較大的主成員設備編號的IRF成員設備發送禁用指示,以使對應較小的主成員設備編號 的IRF成員設備繼續進行報文轉發。本步驟所對應的場景中,在IRF設備分裂後,兩個IRF成員設備所對應的主成員設 備擁有相同的優先級參數,即鏈路健康狀態相一致,不能通過優先級參數的大小直接選擇 出繼續進行報文轉發的IRF成員設備,因此,可以進一步依據對應的主成員設備編號進行 選擇,確定對應較小主成員設備編號的IRF成員設備作為IRF設備繼續進行報文轉發,而禁 用其它分裂出的IRF成員設備進行報文轉發,從而,避免系統中出現設備配置衝突。情況二、基於BFD或ARP故障檢測策略的IRF故障處理方法該方法應用於包含IRF設備的系統中,該IRF設備由兩個IRF成員設備組成,各 IRF成員設備之間通過IRF鏈路相連接,且各IRF成員設備之間建立BFD檢測鏈路或ARP檢 測鏈路。如圖8所示,為本發明提出的一種基於BFD或ARP故障檢測策略的IRF故障處理 方法的流程示意圖,具體包括以下步驟步驟S801、IRF成員設備通過BFD檢測鏈路或ARP檢測鏈路接收另一個IRF成員 設備發送的BFD報文或免費ARP報文。其中,BFD報文或免費ARP報文包含另一個IRF成員設備對應的主成員設備編號以及主成員設備優先級參數。在本步驟實現之前,同樣需要在各IRF成員設備上設置優先級參數的處理機制, 以及識別主成員設備和獲取主成員設備優先級參數的機制,具體說明參見前述的步驟S701 中的描述,在此不再重複說明。一方面,對應BFD故障檢測策略,當IRF成員設備與另一個IRF成員設備建立BFD 會話,並接收到的另一個IRF成員設備所發送的BFD報文,即表示當前IRF設備中的兩個 IRF成員設備之間能夠建立BFD會話,該IRF設備當前已分裂。需要指出的是,BFD報文本身在IRF設備的各IRF成員設備是一直會有發送的,但 是,只是相當於在各IRF成員設備所組成的IRF設備的內部進行報文發送,而不能建立BFD 會話,但是,如果IRF設備發生分裂,分裂後的IRF成員設備相當於彼此獨立的兩個設備,此 時,可以建立BFD會話,因此,在此種情況下,是否建立BFD會話是IRF設備分裂的判斷依 據,而BFD報文本身的發送規則並不是本發明所關係的範圍,發送規則的變化並不影響本 發明的保護範圍。另一方面,對應ARP故障檢測策略,當IRF成員設備接收到的另一個IRF成員設備 所發送的免費ARP報文中攜帶的主成員設備編號不同時,即檢測到主成員設備衝突,判斷 IRF設備分裂。而無論應用上述哪種情況的IRF故障檢測策略,只要判斷IRF設備發生分裂,便執 行後續的步驟S802。步驟S802、IRF成員設備判斷自身對應的主成員設備優先級參數是否小於另一個 IRF成員設備對應的主成員設備優先級參數。如果判斷結果為IRF成員設備自身對應的主成員設備優先級參數小於另一個IRF 成員設備對應的主成員設備優先級參數,執行步驟S803 ;如果判斷結果為IRF成員設備自身對應的主成員設備優先級參數大於另一個IRF 成員設備對應的主成員設備優先級參數,執行步驟S804 ;如果判斷結果為IRF成員設備自身對應的主成員設備優先級參數等於另一個IRF 成員設備對應的主成員設備優先級參數,執行步驟S805。由於IRF設備只包含了兩個IRF成員設備,所以,實際上在IRF設備發生分裂後, 各IRF成員設備所對應的主成員設備即其自身,各IRF成員設備所對應的主成員設備優先 級參數即其自身的優先級參數。所以,本步驟的實際操作內容是IRF成員設備將自身的優先級參數與另一個IRF 成員設備的優先級參數進行比較,具體描述方式的變化並不會影響本發明的保護範圍。步驟S803、IRF成員設備終止報文轉發,以使另一個IRF成員設備繼續進行報文轉發。步驟S804、IRF成員設備繼續進行報文轉發。通過步驟S803或步驟S804,可以在IRF設備分裂後,使對應較小的主成員設備優 先級參數的IRF成員設備終止報文轉發,而選擇對應較大的主成員設備優先級參數,即被 檢測鏈路的狀態最好的IRF成員設備繼續進行報文轉發,從而,在避免系統中出現設備配 置衝突的前提下,使鏈路狀態更好的IRF成員設備繼續進行報文轉發工作。步驟S805、IRF成員設備判斷自身對應的主成員設備編號是否小於另一個IRF成
15員設備對應的主成員設備編號。如果小於,執行步驟S804,IRF成員設備繼續進行報文轉發;如果不小於,執行步驟S803,IRF成員設備終止報文轉發,以使對應較小的主成員 設備編號的IRF成員設備繼續進行報文轉發。本步驟所對應的場景中,在IRF設備分裂後,兩個IRF成員設備所對應的主成員設 備擁有相同的優先級參數,即鏈路健康狀態相一致,不能通過優先級參數的大小直接選擇 出繼續進行報文轉發的IRF成員設備,因此,可以進一步依據對應的主成員設備編號進行 選擇,確定對應較小主成員設備編號的IRF成員設備作為IRF設備繼續進行報文轉發,而禁 用其它分裂出的IRF成員設備進行報文轉發,從而,避免系統中出現設備配置衝突。需要特別指出的是,在實際的應用場景中,對應前述的BFD故障檢測側路,BFD報 文中還可以進一步包括優先級參數標識位。當IRF成員設備通過BFD檢測鏈路與另一個IRF成員設備建立BFD會話,並接收 到另一個IRF成員設備發送的BFD報文時,如果該BFD報文中包含該優先級參數標識位,則 步驟S802中的處理進一步包括以下過程如果BFD報文中的優先級參數標識位標識該BFD報文中攜帶發送該BFD報文的 IRF成員設備對應的主成員設備優先級參數信息,那麼,如前,接收到該BFD報文的IRF成員 設備判斷自身對應的主成員設備優先級參數是否小於接收到的BFD報文中攜帶的主成員 設備優先級參數,如果小於,則轉入步驟S803,如果大於,則轉入步驟S804,如果等於,則轉 入步驟S805。而如果BFD報文中的優先級參數標識位標識該BFD報文中沒有攜帶發送該BFD報 文的IRF成員設備對應的主成員設備優先級參數信息,那麼,接收到該BFD報文的IRF成員 設備則直接轉入步驟S805,通過所對應的主成員設備編號的大小比較進行後續處理。在具體的應用場景中,對於BFD報文,是否包含優先級參數標識位可以根據實際 需要進行設定和調整,這樣的變化並不影響本發明的保護範圍。與現有技術相比,本發明具有以下優點通過應用本發明的技術方案,分別給IRF設備中的每個IRF成員設備設置優先級 參數,監控各自的鏈路狀態,並根據被監控鏈路的狀態調整優先級參數,在各IRF成員設備 所發送的IRF故障檢測報文中攜帶各自所對應的主成員設備優先級參數,從而,在IRF設備 分裂時,可以根據相應的優先級參數,在分裂後的各IRF成員設備中,選擇鏈路狀態更優, 故障更少的設備繼續工作,而禁用其它設備,在確保系統中不會因為IRF設備分裂而產生 衝突的前提下,進一步保證其他鏈路的通信業務,提高系統的可靠性。為了進一步闡述本發明的技術思想,現結合具體的應用場景,對本發明的技術方 案進行說明。在本發明的處理策略中,首先,需要給IRF設備中的每個IRF成員設備設置優先級 參數和被檢測的關鍵鏈路,而由於存在專門的IRF故障檢測機制,所以,被檢測的關鍵鏈路 中並不包括IRF鏈路。各IRF成員設備檢測自身的關鍵鏈路,當發現被檢測的關鍵鏈路發生故障而斷開 時,該IRF成員設備自身的優先級參數下降,但如果被檢測的關鍵鏈路狀態正常,該IRF成 員設備自身的優先級參數則保持不變。
優先級參數下降的具體值與發生故障的關鍵鏈路的數量相關,具體的優先級參數 的調整策略可以根據實際場景需要進行調整計算策略一、設定IRF成員設備的優先級參數初始值以及每個關鍵鏈路發生故障 所要降低的數值,從而,當發生關鍵鏈路的故障時,直接根據發生故障的關鍵鏈路的數量對 應的數值相應的降低優先級參數,例如設定IRF成員設備的優先級參數初始值為500,每個關鍵鏈路發生故障則降低數 值100,那麼,當IRF成員設備檢測到自身的2條關鍵鏈路發生故障時,直接將自身的優先級 參數的數值降低200,計算得到的優先級參數為300。計算策略二、設定IRF成員設備的優先級參數初始值,根據按照發生故障的關鍵 鏈路在全部被檢測的關鍵鏈路所佔的比例計算優先級參數,例如設定IRF成員設備的優先級參數初始值為500,IRF成員設備被檢測的關鍵鏈路的 數量為5條。假設,當IRF成員設備檢測到自身的2條關鍵鏈路發生故障時,發生故障的關 鍵鏈路在全部被檢測的關鍵鏈路所佔的比例為40%,從而,該IRF成員設備將自身的優先 級參數的數值降低40% (降低200),計算得到的優先級參數為300。調整策略三、設定IRF成員設備的優先級參數初始值以及關鍵鏈路發生故障時所 需降低的固定的數值(此策略中可以不考慮發生故障的關鍵鏈路的數量,只要發生故障, 則直接在優先級參數減去設定的固定的數值),例如設定IRF成員設備的優先級參數初始值為500,關鍵鏈路發生故障時降低的數值 為100,IRF成員設備中被檢測的關鍵鏈路的數量為5。假設,當IRF成員設備檢測到自身的 2條關鍵鏈路發生故障時,那麼,該IRF成員設備將自身的優先級參數的數值固定降低100, 計算得到的IRF成員設備的優先級參數為400,在此種情況下,優先級參數只表示該IRF成 員設備的被檢測鏈路是否發生故障,而故障的具體情況則不進行考慮。調整策略四、設定每個關鍵鏈路的對應的數值,當檢測關鍵鏈路故障時,根據正常 關鍵鏈路的數量計算優先級參數。設定IRF成員設備中被檢測的關鍵鏈路的數量為5,每個關鍵鏈路對應優先級參 數的數值為100。假設,當IRF成員設備檢測到自身的2條關鍵鏈路發生故障時,由於還有 3條關鍵鏈路沒有發生故障,計算得到的IRF成員設備的優先級參數為300。需要指出的是,在實際應用中,還可以設定更多其他的計算策略,本發明無法窮盡 舉例所有根據關鍵鏈路的故障狀態和計算策略計算IRF成員設備優先級參數的方法,因 此,凡是可以實現根據關鍵鏈路的故障情況調整優先級參數的策略均可以應用於本發明的 技術方案中,具體的調整策略的內容變化並不會影響本發明的保護範圍。 在上述設置完成後,還需要在LACP報文、BFD報文或免費ARP報文等IRF故障檢測 報文中再增加一個擴展欄位,用來填充該IRF成員設備所對應的主成員設備優先級參數, 在IRF設備發生分裂時,通過LACP報文、BFD報文或免費ARP報文等IRF故障檢測報文的 交互,將對應較低的主成員設備優先級參數的IRF成員設備設置為禁用狀態,而使對應較 高的主成員設備優先級參數的IRF成員設備作為IRF設備繼續正常工作,轉發業務流量。
但如果分裂後的各主成員設備的優先級相同,則設定各主成員設備中對應較小的 主成員設備優先級參數的IRF成員設備作為IRF設備繼續正常工作,轉發業務流量,而分裂 出的其他IRF成員設備處于禁用狀態,不再轉發業務流量。
17
在現有的通過LACP報文和免費ARP報文檢測IRF設備分裂的方法中,都是將LACP 報文和免費ARP報文進行擴展,在擴展欄位中填充主成員設備的成員編號,而在本發明的 技術方案中,則是繼續對LACP報文和免費ARP報文進行擴展,即進一步填充主成員設備優 先級參數。而在現有的通過BFD報文檢測IRF設備分裂的方法中,由於BFD會話的建立本身 就表示IRF設備已經分裂,所以,並沒有對BFD報文的內容進行擴展,相應的BFD報文的結 構示意圖如圖9所示。其中,各欄位的含義如下Vers =BFD協議版本號Diag 診斷字,標明本地BFD系統最後一次會話Down的原因Sta:BFD 本地狀態P:如果標記該標誌,表示參數發生改變或發送系統進行連接時,請求對方立即進 行確認和響應。否則,不請求對方進行確認和響應F 響應P標誌置位的回應報文中必須將F標誌置位C 轉發/控制分離標誌,一旦置位,控制平面的變化不影響BFD檢測A 認證標識,置位代表會話需要進行驗證D 查詢請求,置位代表發送方期望採用查詢模式對鏈路進行監測R 保留位,默認值0Detect Mult 檢測超時倍數,用於檢測方計算檢測超時時間Length:報文長度My Discreaminator :BFD會話連接本地標識符Your Discreaminator :BFD 會話連接遠端標識符Desired Min Tx Interval 本地支持的最小BFD報文發送間隔Required Min RX Interval 本地支持的最小BFD接收間隔Required Min Echo RX Interval 本地支持的最小Echo報文接收間隔Auth Type 認證類型Auth Length 認證數據長度Authentication Data本發明所提出的IRF設備分裂的檢測方法可以通過對R(保留位)來進行擴展如果保留位的值為0,則表示不對BFD報文進行擴展;而如果保留位的值為1,則表示要對BFD報文進行擴展,在該BFD報文的最後面增 加包含主成員設備優先級參數的欄位。本發明所提出的IRF分裂檢測方法與原有方法相比,只在LACP報文、BFD報文和 免費ARP報文中多添加了一個優先級欄位,而IRF分裂的判斷標準不變,在檢測到IRF分裂 後,處理機制要根據LACP報文、BFD報文和免費ARP報文中的優先級欄位來決定繼續轉發 報文的IRF成員設備,即將對應較低的主成員設備優先級參數的IRF成員設備設置為禁用 狀態,而將對應較高的主成員設備優先級參數的IRF成員設備作為IRF設備繼續正常工作, 轉發業務流量。而如果兩個或更多數量的主成員設備的優先級相同,則再按照比較成員編號的方案,讓對應較小的主成員設備編號的IRF成員設備繼續作為IRF設備正常工作,轉發業務流 量,其他IRF成員設備處于禁用狀態,不再轉發業務流量。還是以圖6為例,初始狀態IRF設備中包括設備A和設備B,設備A的成員編號小 於設備B的成員編號。對於設備A和設備B,需要進行設置如下設置設備A的優先級為255,監控鏈路1和鏈路3,當鏈路1或鏈路3中有一個鏈 路斷開時,設備A的優先級降低100。設置設備B的優先級也為255,監控鏈路2和鏈路4,當鏈路2或鏈路4中有一個 鏈路斷開時,設備B的優先級降低100。如果鏈路1發生故障,設備A的優先級變為155,但由於IRF鏈路正常,IRF設備還 是可以正常工作,IRF設備不分裂,也不會進行優先級比較。如果鏈路1發生故障,IRF鏈路也發生故障,設備A和設備B都變成工作在IRF模 式下的主成員設備,通過交互LACP報文、BFD報文或免費ARP報文,可以檢測出IRF設備分裂了。進一步的,再根據LACP報文、BFD報文或免費ARP報文中攜帶的優先級欄位,進行 處理如下(1)設備A知道自己就是主成員設備,而且當前優先級是155,發現設備B所對應 的主成員設備(即設備B)的當前優先級是255,即其中存在唯一的最大值255,且自身所對 應的主成員設備的優先級低於該最大值,這時,優先級較低的設備A會被設置成禁用狀態, 不再轉發業務流量。(2)設備B知道自己就是主成員設備,而且當前優先級是255,發現設備A所對應 的主成員設備(即設備A)的當前優先級是155,即其中存在唯一的最大值255,且自身所對 應的主成員設備的優先級即為該最大值,所以,設備B會作為IRF設備繼續正常工作,轉發 業務流量。通過上述處理,成員編號更小的設備A因為存在鏈路故障,沒有在IRF設備分裂後 繼續工作,而是由鏈路沒有故障的設備B繼續工作,這樣,設備C和設備D之間業務流量還 可以繼續通過鏈路2和鏈路4,經過設備B進行正常轉發。以上是IRF設備包括兩個IRF成員設備的應用場景,下面進一步通過圖9所示的 場景,說明在IRF設備包含更多IRF成員設備的情況下,本發明所提出的技術方案的處理流程。在如圖10所示的應用場景中,初始狀態IRF設備中包括設備A、設備B和設備C, 設備A的成員編號小於設備B的成員編號,設備B的成員編號進一步小於設備C的成員編號。對於設備A、設備B和設備C,需要進行設置如下設置設備A的優先級為255,監控鏈路1和鏈路4,當鏈路1或鏈路4中有一個鏈 路斷開時,設備A的優先級降低100。設置設備B的優先級也為255,監控鏈路2和鏈路5,當鏈路2或鏈路5中有一個 鏈路斷開時,設備B的優先級降低100。設置設備C的優先級也為255,監控鏈路3和鏈路6,當鏈路3或鏈路6中有一個鏈路斷開時,設備C的優先級降低100。如果鏈路1發生故障,設備A的優先級變為155,但由於IRF鏈路正常,IRF設備還 是可以正常工作,IRF設備不分裂,也不會進行優先級比較。如果鏈路1發生故障,IRF鏈路也發生故障,設備C脫離原有的IRF設備,因此,IRF 設備分裂為兩個工作在IRF模式下的IRF設備,其中,一個IRF設備包括設備A和設備B,其 中,設備A為該IRF設備中的主成員設備,設備B為該IRF設備中的從成員設備,設備C則 獨自成為一個IRF設備,其自身就是該IRF設備中的主成員設備,通過交互LACP報文、BFD 報文或免費ARP報文,可以檢測出IRF設備分裂了。進一步的,再根據LACP報文、BFD報文或免費ARP報文中攜帶的優先級欄位,進行 處理如下(1)設備A知道自己就是主成員設備,而且當前優先級是155 (雖然設備B的優先 級為255,但是設備B是從成員設備,因此,只以作為主成員設備的設備A的優先級為判斷依 據),發現設備C所對應的主成員設備(即設備C)的當前優先級是255,即其中存在唯一的 最大值255,且自身所對應的主成員設備的優先級低於該最大值,這時,優先級較低的設備 A會被設置成禁用狀態,不轉發業務流量。(2)設備B知道自己所對應的主成員設備是設備A,而且設備A當前優先級是 155 (雖然設備B的優先級為255,但是設備B是從成員設備,因此,只以作為主成員設備的 設備A的優先級為判斷依據),發現設備C所對應的主成員設備(即設備C)的當前優先級 是255,即其中存在唯一的最大值255,且自身所對應的主成員設備(設備A)的優先級低於 該最大值,這時,對應了較低優先級的主成員設備的設備B會被設置成禁用狀態,不轉發業 務流量。(3)設備C知道自己就是主成員設備,而且當前優先級是255,發現設備A和設備 B所對應的主成員設備(即設備A)的當前優先級是155,即其中存在唯一的最大值255,且 自身所對應的主成員設備的優先級即為該最大值,所以,設備C會作為IRF設備繼續正常工 作,轉發業務流量。通過上述處理,成員編號更小的設備A因為存在鏈路故障,其和設備B所組成的 IRF設備沒有在IRF設備分裂後繼續工作,而是由鏈路沒有故障的設備C繼續工作,這樣,設 備D和設備E之間業務流量還可以繼續通過鏈路3和鏈路6,經過設備C進行正常轉發。在上述過程中,如果發送LACP報文、BFD報文或免費ARP報文,那麼其中所攜帶的 優先級如下設備A和設備C由於自身就是主成員設備,其所發送的報文中直接攜帶自身的優 先級,而設備B所對應的主成員設備是設備A,所以,設備B所發送的報文中攜帶設備A的優 先級。需要進一步說明的是,上述的優先級所設定的數值,調整策略等均可以根據實際 需要進行調整,這樣的變化並不影響本發明的保護範圍。與現有技術相比,本發明具有以下優點通過應用本發明的技術方案,分別給IRF設備中的每個IRF成員設備設置優先級 參數,監控各自的鏈路狀態,並根據被監控鏈路的狀態調整優先級參數,在各IRF成員設備 所發送的IRF故障檢測報文中攜帶各自所對應的主成員設備優先級參數,從而,在IRF設備
20分裂時,可以根據相應的優先級參數,在分裂後的各IRF成員設備中,選擇鏈路狀態更優, 故障更少的設備繼續工作,而禁用其它設備,在確保系統中不會因為IRF設備分裂而產生 衝突的前提下,進一步保證其他鏈路的通信業務,提高系統的可靠性。為了實現本發明的技術方案,基於前述的說明,本發明還提出了一種基於LACP故 障檢測策略的IRF故障檢測系統,其結構示意圖如圖11所示,包括IRF設備和故障檢測設 備111,IRF設備由兩個IRF成員設備112組成,兩個IRF成員設備112之間通過IRF鏈路 相連接,故障檢測設備111與IRF設備動態聚合,並分別與IRF設備中的兩個IRF成員設備 112建立LACP檢測鏈路,其中故障檢測設備111包括第一接收模塊1111、第一處理模塊1112以及第一發送模塊 1113 第一接收模塊1111,用於通過LACP檢測鏈路接收各IRF成員設備112發送的LACP 報文,其中,LACP報文包含IRF設備對應的主成員設備編號以及主成員設備優先級參數。第一處理模塊1112,用於根據接收的LACP報文判斷兩個IRF設備是否發生分裂, 若判斷IRF設備發生分裂時,則比較兩個IRF成員設備112對應的主成員設備優先級參數, 若比較結果為不同,則通知第一發送模塊1113向對應較小的主成員設備優先級參數的IRF 成員設備112發送禁用指示。第一發送模塊1113,用於根據第一處理模塊1112的通知,向對應較小的主成員設 備優先級參數的IRF成員設備112發送禁用指示,以使所對應較大的主成員設備優先級參 數的IRF成員設備112繼續進行報文轉發。在具體的應用場景中,第一處理模塊1112,還用於在比較兩個IRF成員設備112所對應的主成員設備優先級參數相同時,比較兩個 IRF成員設備112所對應的主成員設備編號,並通知第一發送模塊1113向對應較大主成員 設備編號的IRF成員設備112發送禁用指示。IRF成員設備112包括第二發送模塊1121、第二接收模塊1122以及第二處理模塊 1123 ;第二發送模塊1121,用於通過LACP檢測鏈路向故障檢測設備111發送LACP報文;第二接收模塊1122,用於接收禁用指示;第二處理模塊1123,用於根據接收的禁用指示停止進行報文轉發。進一步的,IRF成員設備112,還包括第二設置模塊1124,用於分別設置優先級參數計算策略和被檢測鏈路,其中,被檢 測鏈路具體為IRF成員設備112上除IRF鏈路外的鏈路;第二檢測模塊1125,與第二設置模塊1124相連接,用於檢測第二設置模塊1124所 設置的被檢測鏈路是否發生故障;第二計算模塊1126,與第二設置模塊1124和第二檢測模塊1125相連接,用於在第 二檢測模塊1125檢測到被檢測鏈路發生故障時,根據第二設置模塊1124所設置的優先級 參數計算策略計算IRF成員設備112自身的優先級參數。另一方面,一種基於BFD或ARP故障檢測策略的IRF故障檢測系統,其結構示意圖 如圖12所示,包括由兩個IRF成員設備121所組成的IRF設備,兩個IRF設備之間通過IRF 鏈路相連接,且兩個IRF成員設備121之間建立BFD檢測鏈路或ARP檢測鏈路,其中
21
IRF成員設備121包括設置模塊1211、接收模塊1212、判斷模塊1213和處理模塊 1214 設置模塊1211,用於設置IRF故障檢測策略;接收模塊1212,與設置模塊1211相連接,用於根據設置模塊1211所設置的IRF故 障檢測策略,通過BFD鏈路接收另一個IRF成員設備121發送的BFD報文,並在IRF設備發 生分裂時,與另一個IRF成員設備121建立BFD會話,或通過ARP鏈路接收另一個IRF成員 設備121發送的免費ARP報文,BFD報文或免費ARP報文包含另一個IRF成員設備121對 應的主成員設備編號以及主成員設備優先級參數;判斷模塊1213,與接收模塊1212相連接,用於在接收模塊1212與另一個IRF成 員設備121建立BFD會話,或接收模塊1212所接收的免費ARP報文表示IRF設備發生分裂 時,判斷IRF成員設備121自身對應的主成員設備優先級參數是否小於接收模塊1212所接 收的BFD報文或免費ARP報文所攜帶的另一個IRF成員設備121對應的主成員設備優先級 參數;處理模塊1214,與判斷模塊1213相連接,用於在判斷模塊1213的判斷結果為小 於時,終止IRF成員設備121進行報文轉發,以使另一個IRF成員設備121繼續進行報文轉發。進一步的,IRF成員設備121,還包括檢測模塊1215、計算模塊1216和發送模塊 1217 設置模塊1211,還用於設置優先級參數計算策略和被檢測鏈路,其中,被檢測鏈路 具體為IRF成員設備121上除IRF鏈路外的鏈路;檢測模塊1215,與設置模塊1211相連接,用於檢測設置模塊1211所設置的被檢測 鏈路是否發生故障;計算模塊1216,與設置模塊1211和檢測模塊1215相連接,用於在檢測模塊1215 檢測到被檢測鏈路發生故障時,根據設置模塊1211所設置的優先級參數計算策略計算自 身的優先級參數;發送模塊1217,與設置模塊1211和計算模塊1216相連接,用於根據設置模塊 1211所設置的IRF故障檢測策略,通過BFD檢測鏈路或ARP檢測鏈路向另一個IRF成員設 備121發送BFD報文或免費ARP報文,BFD報文或免費ARP報文包含IRF成員設備121對 應的主成員設備編號以及主成員設備優先級參數。進一步的,處理模塊1214,還用於在判斷模塊1213的判斷結果為IRF成員設備121自身對應的主成員設備優先級 參數大於另一個IRF成員設備121對應的主成員設備優先級參數時,保持IRF成員設備121 繼續進行報文轉發;或,在判斷模塊1213的判斷結果為IRF成員設備121自身對應的主成員設備優先級 參數等於另一個IRF成員設備121對應的主成員設備優先級參數時,通知判斷模塊1213判 斷IRF成員設備121對應的主成員設備編號是否小於另一個IRF成員設備121對應的主成 員設備編號,如果小於,保持IRF成員設備121繼續進行報文轉發,如果不小於,終止IRF成 員設備121進行報文轉發,以使對應較小的主成員設備編號的IRF成員設備121繼續進行 報文轉發。
與現有技術相比,本發明具有以下優點通過應用本發明的技術方案,分別給IRF設備中的每個IRF成員設備設置優先級 參數,監控各自的鏈路狀態,並根據被監控鏈路的狀態調整優先級參數,在各IRF成員設備 所發送的IRF故障檢測報文中攜帶各自所對應的主成員設備優先級參數,從而,在IRF設備 分裂時,可以根據相應的優先級參數,在分裂後的各IRF成員設備中,選擇鏈路狀態更優, 故障更少的設備繼續工作,而禁用其它設備,在確保系統中不會因為IRF設備分裂而產生 衝突的前提下,進一步保證其他鏈路的通信業務,提高系統的可靠性。通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本發明可以通 過硬體實現,也可以藉助軟體加必要的通用硬體平臺的方式來實現。基於這樣的理解,本發 明的技術方案可以以軟體產品的形式體現出來,該軟體產品可以存儲在一個非易失性存儲 介質(可以是⑶-ROM,U盤,移動硬碟等)中,包括若干指令用以使得一臺計算機設備(可 以是個人計算機,伺服器,或者網絡設備等)執行本發明各個實施場景所述的方法。本領域技術人員可以理解附圖只是一個優選實施場景的示意圖,附圖中的模塊或 流程並不一定是實施本發明所必須的。本領域技術人員可以理解實施場景中的裝置中的模塊可以按照實施場景描述進 行分布於實施場景的裝置中,也可以進行相應變化位於不同於本實施場景的一個或多個裝 置中。上述實施場景的模塊可以合併為一個模塊,也可以進一步拆分成多個子模塊。上述本發明序號僅僅為了描述,不代表實施場景的優劣。以上公開的僅為本發明的幾個具體實施場景,但是,本發明並非局限於此,任何本 領域的技術人員能思之的變化都應落入本發明的保護範圍。
權利要求
一種基於智能彈性架構IRF故障處理方法,應用於包括IRF設備和故障檢測設備的系統中,所述IRF設備由兩個IRF成員設備組成,各所述IRF成員設備之間通過IRF鏈路相連接,所述故障檢測設備與所述IRF設備動態聚合,並分別與所述IRF設備中的各IRF成員設備建立鏈路聚合控制協議LACP檢測鏈路,其特徵在於,所述方法至少包括以下步驟所述故障檢測設備通過所述LACP檢測鏈路接收各所述IRF成員設備發送的LACP報文,所述LACP報文包含IRF成員設備對應的主成員設備編號以及主成員設備優先級參數;所述故障檢測設備根據接收的所述LACP報文判斷所述IRF設備發生分裂時,比較兩個所述IRF成員設備對應的主成員設備優先級參數;所述故障檢測設備確定兩個所述IRF成員設備對應的主成員設備優先級參數不同時,向對應較小的主成員設備優先級參數的IRF成員設備發送禁用指示,以使對應較大的主成員設備優先級參數的IRF成員設備繼續進行報文轉發。
2.如權利要求1所述的方法,其特徵在於,所述故障檢測設備通過所述LACP檢測鏈路 接收各所述IRF成員設備發送的LACP報文之前,所述方法還包括;設置各所述IRF成員設備優先級參數計算策略和被檢測鏈路,其中,所述被檢測鏈路 具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;各所述IRF成員設備分別檢測所設置的被檢測鏈路是否發生故障;當所述IRF成員設備檢測到被檢測鏈路發生故障時,所述IRF成員設備根據設置的優 先級參數計算策略計算優先級參數。
3.如權利要求1所述的方法,其特徵在於,所述方法還包括所述故障檢測設備確定兩個所述IRF成員設備對應的主成員設備優先級參數相同時, 比較各IRF成員設備所對應的主成員設備編號,並向對應較大的主成員設備編號的IRF成 員設備發送禁用指示,以使對應較小的主成員設備編號的IRF成員設備繼續進行報文轉 發。
4.一種IRF故障檢測系統,包括IRF設備和故障檢測設備,所述IRF設備由兩個IRF成 員設備組成,各所述IRF成員設備之間通過IRF鏈路相連接,所述故障檢測設備與所述IRF 設備動態聚合,並分別與所述IRF設備中的各IRF成員設備建立LACP檢測鏈路,其特徵在 於,包括所述故障檢測設備包括第一接收模塊、第一處理模塊以及第一發送模塊;所述第一接收模塊,用於通過所述LACP檢測鏈路接收各所述IRF成員設備發送的LACP 報文,其中,所述LACP報文包含IRF設備對應的主成員設備編號以及主成員設備優先級參 數;所述第一處理模塊,用於根據接收的所述LACP報文判斷兩個所述IRF設備是否發生分 裂,若判斷所述IRF設備發生分裂時,則比較兩個所述IRF成員設備對應的主成員設備優先 級參數,若比較結果為不同,則通知所述第一發送模塊向對應較小的主成員設備優先級參 數的IRF成員設備發送禁用指示;所述第一發送模塊,用於根據所述第一處理模塊的通知,向對應較小的主成員設備優 先級參數的IRF成員設備發送禁用指示,以使所對應較大的主成員設備優先級參數的IRF 成員設備繼續進行報文轉發。
5.如權利要求4所述的IRF故障檢測系統,其特徵在於,所述IRF成員設備包括第二發送模塊、第二接收模塊以及第二處理模塊;所述第二發送模塊,用於通過所述LACP檢測鏈路向所述故障檢測設備發送所述LACP 報文;所述第二接收模塊,用於接收所述禁用指示;所述第二處理模塊,用於根據接收的所述禁用指示停止進行報文轉發。
6.如權利要求4所述的IRF故障檢測系統,其特徵在於,所述IRF成員設備,進一步包括第二設置模塊,用於分別設置優先級參數計算策略和被檢測鏈路,其中,所述被檢測鏈 路為所述IRF成員設備上除所述IRF鏈路外的鏈路;第二檢測模塊,與所述第二設置模塊相連接,用於檢測所述第二設置模塊所設置的被 檢測鏈路是否發生故障;第二計算模塊,與所述第二設置模塊和所述第二檢測模塊相連接,用於在所述第二檢 測模塊檢測到被檢測鏈路發生故障時,根據所述第二設置模塊所設置的優先級參數計算策 略計算自身的優先級參數。
7.如權利要求4所述的IRF故障檢測系統,其特徵在於,所述第一處理模塊,還用於 在比較兩個所述IRF成員設備所對應的主成員設備優先級參數相同時,比較兩個所述IRF成員設備所對應的主成員設備編號,並通知所述第一發送模塊向對應較大主成員設備 編號的IRF成員設備發送禁用指示。
8.一種IRF故障處理方法,應用於包含IRF設備的系統中,所述IRF設備由兩個IRF成 員設備組成,各所述IRF成員設備之間通過IRF鏈路相連接,且各所述IRF成員設備之間建 立雙向轉發檢測BFD檢測鏈路或地址解析協議ARP檢測鏈路,其特徵在於,所述方法至少包 括以下步驟IRF成員設備通過所述BFD檢測鏈路或ARP檢測鏈路接收另一個IRF成員設備發送的 BFD報文或ARP報文,所述BFD報文或ARP報文包含另一個IRF成員設備對應的主成員設備 編號以及主成員設備優先級參數;所述IRF成員設備根據接收的所述BFD報文或ARP報文判斷兩個所述IRF設備發生分 裂時,則判斷自身對應的主成員設備優先級參數是否小於所述另一個IRF成員設備對應的 主成員設備優先級參數;如果判斷結果為小於,所述IRF成員設備終止報文轉發,以由所述另一個IRF成員設備 繼續進行報文轉發。
9.如權利要求8所述的方法,其特徵在於,所述IRF成員設備通過所述BFD檢測鏈路或 ARP檢測鏈路接收另一個IRF成員設備發送的BFD報文或ARP報文,還包括;設置各所述IRF成員設備優先級參數計算策略和被檢測鏈路,其中,所述被檢測鏈路 具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;各所述IRF成員設備分別檢測所設置的被檢測鏈路是否發生故障; 當所述IRF成員設備檢測到被檢測鏈路發生故障時,所述IRF成員設備根據設置的優 先級參數計算策略計算優先級參數。
10.如權利要求8所述的方法,其特徵在於,所述IRF成員設備根據接收的所述BFD報 文或ARP報文判斷兩個所述IRF設備發生分裂時,判斷自身對應的主成員設備優先級參數3是否小於所述另一個IRF成員設備對應的主成員設備優先級參數,具體為當所述IRF成員設備通過所述BFD檢測鏈路與另一個IRF成員設備建立BFD會話,並 接收到另一個IRF成員設備發送的包含自身對應的主成員設備優先級參數的BFD報文時, 所述IRF成員設備判斷自身對應的主成員設備優先級參數是否小於所述BFD報文中攜帶的 主成員設備優先級參數;或,當所述IRF成員設備接收到另一個IRF成員設備發送的包含自身對應的主成員設備優 先級參數的ARP報文,且根據所述ARP報文判斷所述IRF設備發生分裂時,所述IRF成員設 備判斷自身對應的主成員設備優先級參數是否小於所述ARP報文中攜帶的主成員設備優 先級參數。
11.如權利要求10所述的方法,其特徵在於,所述另一個IRF成員設備所發送的包含自 身對應的主成員設備編號以及主成員設備優先級參數的BFD報文中,還包括優先級參數標 識位,如果所述BFD報文中的優先級參數標識位標識所述BFD報文中攜帶優先級參數信息, 所述IRF成員設備判斷自身對應的主成員設備優先級參數是否小於所述BFD報文中攜帶的 主成員設備優先級參數;如果所述BFD報文中的優先級參數標識位標識所述BFD報文中沒有攜帶優先級參數信 息,所述IRF成員設備判斷自身對應的主成員設備編號是否小於另一個IRF成員設備對應 的主成員設備編號,如果小於,所述IRF成員設備繼續進行報文轉發,如果不小於,所述IRF 成員設備終止報文轉發,以使對應較小的主成員設備編號的IRF成員設備繼續進行報文轉 發。
12.如權利要求8、10或11所述的方法,其特徵在於,所述方法還包括如果判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數大於另一個IRF 成員設備對應的主成員設備優先級參數,所述IRF成員設備繼續進行報文轉發;如果判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數等於另一個IRF 成員設備對應的主成員設備優先級參數,所述IRF成員設備判斷自身對應的主成員設備編 號是否小於另一個IRF成員設備對應的主成員設備編號,如果小於,所述IRF成員設備繼續 進行報文轉發,如果大於,所述IRF成員設備終止報文轉發,由對應較小的主成員設備編號 的所述另一個IRF成員設備繼續進行報文轉發。
13.—種IRF故障檢測系統,包括由兩個IRF成員設備所組成的IRF設備,兩個IRF設 備之間通過IRF鏈路相連接,且兩個所述IRF成員設備之間建立BFD檢測鏈路或ARP檢測 鏈路,其特徵在於,包括所述IRF成員設備包括設置模塊、接收模塊、判斷模塊和處理模塊所述設置模塊,用於設置IRF故障檢測策略;所述接收模塊,與所述設置模塊相連接,用於根據所述設置模塊所設置的IRF故障檢 測策略,通過所述BFD鏈路接收另一個IRF成員設備發送的BFD報文,並在所述IRF設備發 生分裂時,與所述另一個IRF成員設備建立BFD會話,或通過ARP鏈路接收另一個IRF成員 設備發送的ARP報文,所述BFD報文或ARP報文包含另一個IRF成員設備對應的主成員設 備編號以及主成員設備優先級參數;所述判斷模塊,與所述接收模塊相連接,用於在所述接收模塊與所述另一個IRF成員設備建立BFD會話,或所述接收模塊所接收的ARP報文表示所述IRF設備發生分裂時,判斷 所述IRF成員設備自身對應的主成員設備優先級參數是否小於所述接收模塊所接收的所 述BFD報文或ARP報文所攜帶的所述另一個IRF成員設備對應的主成員設備優先級參數;所述處理模塊,與所述判斷模塊相連接,用於在所述判斷模塊的判斷結果為小於時,終 止所述IRF成員設備進行報文轉發,以由所述另一個IRF成員設備繼續進行報文轉發。
14.如權利要求13所述的IRF故障檢測系統,其特徵在於,所述IRF成員設備,還包括 檢測模塊、計算模塊和發送模塊所述設置模塊,還用於設置優先級參數計算策略和被檢測鏈路,其中,所述被檢測鏈路 具體為所述IRF成員設備上除所述IRF鏈路外的鏈路;所述檢測模塊,與所述設置模塊相連接,用於檢測所述設置模塊所設置的被檢測鏈路 是否發生故障;所述計算模塊,與所述設置模塊和所述檢測模塊相連接,用於在所述檢測模塊檢測到 被檢測鏈路發生故障時,根據所述設置模塊所設置的優先級參數計算策略計算自身的優先 級參數;所述發送模塊,與所述設置模塊和所述計算模塊相連接,用於根據所述設置模塊所設 置的IRF故障檢測策略,通過所述BFD檢測鏈路或ARP檢測鏈路向另一個IRF成員設備發 送BFD報文或ARP報文,所述BFD報文或ARP報文包含所述IRF成員設備對應的主成員設 備編號以及主成員設備優先級參數。
15.如權利要求13所述的IRF故障檢測系統,其特徵在於,所述處理模塊,還用於在所述判斷模塊的判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數大於另一個IRF成員設備對應的主成員設備優先級參數時,保持所述IRF成員設備繼續進 行報文轉發;或,在所述判斷模塊的判斷結果為所述IRF成員設備自身對應的主成員設備優先級參數 等於另一個IRF成員設備對應的主成員設備優先級參數時,通知所述判斷模塊判斷所述 IRF成員設備對應的主成員設備編號是否小於另一個IRF成員設備對應的主成員設備編 號,如果小於,保持所述IRF成員設備繼續進行報文轉發,如果不小於,終止所述IRF成員設 備進行報文轉發,以使對應較小的主成員設備編號的IRF成員設備繼續進行報文轉發。
全文摘要
本發明公開了一種IRF故障處理方法和IRF故障檢測系統,分別給IRF設備中的每個IRF成員設備設置優先級參數,監控各自的鏈路狀態,並根據被監控鏈路的狀態調整優先級參數,在各IRF成員設備所發送的IRF故障檢測報文中攜帶各自所對應的主成員設備優先級參數,從而,在IRF設備分裂時,可以根據相應的優先級參數,在分裂後的各IRF成員設備中,選擇鏈路狀態更優,故障更少的設備繼續工作,而禁用其它設備,在確保系統中不會因為IRF設備分裂而產生衝突的前提下,進一步保證其他鏈路的通信業務,提高系統的可靠性。
文檔編號H04L12/56GK101917287SQ20101024382
公開日2010年12月15日 申請日期2010年8月4日 優先權日2010年8月4日
發明者熊定山, 王一成 申請人:杭州華三通信技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀