新四季網

多跳錯誤恢復的製作方法

2023-04-25 06:20:41

多跳錯誤恢復的製作方法
【專利摘要】涉及對使用「墊腳石」交換機的逐跳分組轉發技術的使用的方法、裝置和網絡架構。該網絡架構包括使用穿插在非墊腳石交換機中的墊腳石交換機,非墊腳石交換機為諸如包括如交換機、路由器、轉發器等網絡元件的常規網絡交換機。墊腳石交換機被配置成以帶有錯誤恢復的逐跳方式將分組作為沿墊腳石交換機之間的隧穿子路徑的復用流進行路由,這不同於使用任意路徑或沿(一般)較長的基於流的路徑將分組從源路由至目的地的常規路由。因此,來自源端點的分組經由連接各對墊腳石交換機的多條子路徑路由至目的地端點,其中每條子路徑經過一個或多個常規交換機並且組成逐跳路線中的邏輯跳躍。
【專利說明】多跳錯誤恢復

【技術領域】
[0001]本發明的領域一般涉及計算機聯網,且更具體但不排他地涉及使用帶有錯誤恢復的多跳轉發來支持增強網絡性能的網絡架構和網絡交換機。
[0002]背景信息
[0003]自從引入微處理器以來,計算機系統已變得越來越快。近似根據摩爾定律(基於Intel?公司共同創設者戈登摩爾在1965年預測集成電路上電晶體數目每兩年翻一倍的出版物),增速已經以相當均勻的速率急速上升了近三十年。同時,存儲器和非易失性存儲兩者的尺寸已穩步增加,從而使得許多當今的個人計算機相比僅10-15年以前的超級計算機更加強大。另外,網絡通信速度同樣也可見巨大增加。
[0004]處理器速度、存儲器、存儲以及網絡帶寬技術的增長造成了對於具有日益增長的能力的網絡的擴建和部署。最近,基於雲的服務的引入,如Amazon(例如,亞馬遜彈性計算雲(EC2)以及簡單存儲服務(S3))和微軟(例如,Azure和0ffice365)所提供的那些服務,已經造成了對於公共網絡基礎設施的附加網絡擴建,並造成了對大容量數據中心的增加部署以支持使用私有網絡基礎設施的這些服務。另外,在不久的將來,新一代(即,4G)行動網路數據服務預計會顯著地影響陸線網絡的利用。這些以及其他考慮的結果是在可預見的將來,計算機網絡的利用預期會繼續高速增長。
[0005]圖1描繪了採用經由鏈路104通信地耦合至彼此的標記為1-36的多個交換機102的常規計算機網絡架構100。源計算機106經由網際網路服務提供商(ISP)網絡108耦合至交換機14。在網絡另一側,包括電子郵件伺服器的目的地計算機110經由電子郵件服務提供商(ESP)網絡112連接至交換機20。
[0006]每個交換機1-35包括路由表或轉發表,其用於基於各種準則將分組路由/轉發至下一跳,該準則通常包括目的地地址。在諸如網際協議(IP)等各種路由協議下,數據被劃分成多個分組,這些分組沿諸如源計算機106和目的地計算機110所描繪的源端點與目的地端點之間的路徑路由。一般而言,給定分組經過的分組可以在一定程度上是任意的,這是為何網際網路如此穩健的部分原因。由於端點之間的分組可沿不同路逕行進,因此當網絡交換機停機或離線時,其他交換機的路由表被更新以沿不包括該交換機的路徑路由分組。
[0007]圖1進一步示出包括交換機14、15、22、23、16、17、18和19之間的跳躍的示例性路由路徑。當然,後續分組可沿不同路線路由,取決於正在源計算機106與目的地計算機110之間傳送的話務的分類、以及實時網絡工作條件和由各個網絡交換機處置的話務。
[0008]在計算機網絡中,分組可能由於各種原因而丟失,這些原因包括比特錯誤、擁塞、或交換機故障。當分組在源與其目的地之間的路徑上丟失時,其通常需要從源重傳。這具有兩個問題。首先,由於從源到目的地的路徑相當長,源要花費長時間來發現分組已丟失。第二,該分組在丟棄之前所作的進展浪費了帶寬。
[0009]在具有許多比特錯誤的有損耗鏈路上,有時完成逐跳可靠性。這意味著當第一交換機SI正向鄰交換機S2轉發時,SI和S2運行可靠協議,其中SI保持每個分組直至其被S2確認為被成功接收而無錯誤,重傳丟失或丟棄的分組。此類協議的示例是高級數據鏈路控制(HDLC)或數字數據通信消息協議(DDCMP)。這要求更複雜和昂貴的交換機,因為其要求更多緩衝器供SI保持分組直至接收到來自S2的確認。
[0010]避免由於鏈路上的比特錯誤而引起的分組丟失的另一辦法是使用糾錯碼,從而倘若沒有過多比特錯誤則分組可被重構。這在額外校驗和比特與計算兩方面具有很多開銷,並且仍有可能存在比糾錯碼能處置的更多的錯誤。
[0011]網絡擁塞目前以兩種方式之一來解決:丟棄分組或在傳入埠上實現回壓(通常在每服務類的基礎上)。如前所述,丟棄分組的問題在於已朝著目的地行進了數跳的分組必須再次從源重傳,從而帶寬量被浪費了。另外,源發現分組已丟棄的端到端延遲可能較長,這是因為需要從目的地傳達關於分組是否已被接收的信息。結果,源在重發分組之前將通常採用超時,如果在超時期滿之前沒有接收到ACK則重發分組。
[0012]進行傳統方式的回壓(例如,Infiniband或數據中心橋接)的問題在於擁塞會延伸;單個較慢資源(例如,目的地)可使其分組佔用交換機中的所有緩衝器,並且由於交換機不被允許丟棄那些分組,該交換機必須拒絕接收(該類的)任何更多分組,即使那些新分組可能並不是朝向擁塞資源行進。這進而可導致毗鄰交換機中的緩衝器變滿,等等。
[0013]附圖簡述
[0014]通過參考與附圖一起進行的下面的詳細描述,本發明的前述的方面和許多伴隨的優點,將變得更加輕鬆地被理解,其中,在各個視圖中,相同參考編號表示相同部件,除非另作說明:
[0015]圖1是示出其中多個交換機經由各種鏈路互連的常規計算機網絡的網絡示圖;
[0016]圖2是示出採用穿插在常規網絡交換機元件中的多個墊腳石(st印ping stone)交換機的計算機網絡的網絡示圖;
[0017]圖2a是示出圖2的網絡示圖僅描繪有墊腳石交換機、連同各對墊腳石交換機之間連接的隧穿虛擬鏈路時的視圖的網絡示圖;
[0018]圖2b是示出包括兩個分層級別的網絡架構的視圖的網絡示圖,其示出圖2a的網絡不圖重置在圖2的網絡不圖上;
[0019]圖3示出常規計算機網絡中在源和目的地計算機之間的一對路由路徑;
[0020]圖4示出源和目的地計算機之間採用墊腳石交換機的逐跳路由路徑;
[0021]圖5a示出源和目的地計算機之間包括各對墊腳石交換機之間的兩條隧穿子路徑的路由路徑;
[0022]圖5b_5d示出在經由圖5a的路由路徑中的交換機轉發分組時的分組格式和報頭配置;
[0023]圖6是示出根據一個實施例的在經由逐跳技術轉發分組時由墊腳石交換機和常規交換機執行的操作和邏輯的流程圖;
[0024]圖7a是示出在一對墊腳石交換機之間的隧穿子路徑上復用分組流的示圖;
[0025]圖7b示出與圖7a中的墊腳石交換機相對應的分組流以及相關聯的源和目的地緩衝器;
[0026]圖7c描繪圖7a的墊腳石交換機之間的隧穿子路徑;
[0027]圖8示出根據一個實施例的墊腳石隧道報頭;
[0028]圖8a示出根據一個實施例的用於分組拒絕的墊腳石隧道報頭;
[0029]圖9示出包括多個被配置為墊腳石交換機裝置的交換線路卡的示例性交換機;以及
[0030]圖10示出被配置為墊腳石交換機裝置的示例性交換線路卡。
[0031]詳細描述
[0032]本文描述了使用帶有錯誤恢復的逐跳轉發來增強網絡性能的方法和裝置的實施例。在以下描述中,闡述了許多具體細節以提供對本發明的實施例的透徹理解。然而,相關領域內技術人員將理解本發明可省去一個或多個特定細節而實現,或通過其它方法、組件、材料等實現。在其它例子中,公知的結構、材料或操作不被示出或詳細說明以避免對本發明某些方面產生混淆。
[0033]說明書中對〃 一個實施例"、〃實施例〃的引用意味著結合該實施例所描述的特定特徵、結構或特性被包括在本發明的至少一個實施例中。如此,在整個說明書中的不同位置出現短語「在一個實施例中」或「在實施例中」不一定都是指同一個實施例。此外,在一個或多個實施例中,特定特徵、結構或特性可以以任何合適的方式組合起來。
[0034]根據本文所公開的實施例的一方面,經由使用穿插在常規網絡交換機中的「墊腳石」交換機來促進增強的網絡性能。墊腳石交換機被配置成以逐跳方式將分組作為墊腳石交換機之間的流進行轉發,這不同於使用任意路徑或沿(一般)較長的基於流的路徑將分組從源路由至目的地的常規轉發。(如本文在該詳細描述中所使用的,沒有大寫的「hop (跳躍/跳)」對應於該術語的常規網絡使用,而有大寫的「Hop」對應於墊腳石交換機之間邏輯跳躍)。因此,來自源端點的分組經由多個墊腳石交換機路由至目的地端點,其中各對墊腳石之間的流通常經過一個或多個常規交換機並且構成Hop。
[0035]基本概念是具有配置有用於某個數目的流的充分資源的一些交換機(即,墊腳石),從而它們可保持分組並且如果需要則重傳它們,直至它們被下一個墊腳石確認。並非所有流都需要利用墊腳石服務,並且不使用墊腳石服務的那些流可根據傳統聯網來處置,即要麼通過盡力型(例如,如果需要則丟棄,並且如果要求可靠性,則從源或逐跳地重傳)要麼通過連同相同類中的其他流進行回壓。
[0036]在一些實施例中,墊腳石交換機的配置類似於常規交換機,除了墊腳石交換機具有顯著更多的緩衝器資源(以及用於創建和復用分組流、創建子路徑Hop、以及擴充轉發表的附加邏輯,如以下詳述的)。由於採用墊腳石之間的流以使得一對墊腳石交換機之間的給定流的分組經由包括一個或多個中間常規交換機的子路徑來路由,因此這些中間交換機可用較少緩衝器資源來實現。例如,在一些實施例中,經由給定中間交換機路由的大多數或所有話務(從該交換機的觀點而言)看上去是在兩個墊腳石之間(即,墊腳石看上去是源和目的地端點)。因此,沿流路線的一個或多個常規交換機必須維持的緩衝器數目減少(相比於常規網絡架構),從而減少了丟棄分組的發生以及在中間交換機採用回壓的需要。
[0037]圖2示出網絡200,其示出採用經由多條鏈路206通信地連結的網絡交換機202 (標記為1-28)和墊腳石交換機204 (標記為1_5,黑底上的白色數字)的混合的示例性網絡架構。一般而言,每個交換機202可包括常規網絡元件,諸如配置成執行與圖1的交換機102所執行的類似的常規路由/轉發操作的交換機或路由器。除了支持常規路由/轉發操作以外,每個墊腳石交換機204被配置成支持附加路由/轉發操作並且包括附加緩衝器資源(相對於交換機202而言)。
[0038]根據一方面,網絡200包括具有兩個分層級別的網絡,一個分層級別由交換機202和墊腳石交換機204佔用,而另一個分層級別僅由墊腳石交換機204佔用。例如,圖2a示出由墊腳石交換機204佔用的較高分層級別,墊腳石交換機204經由隧穿虛擬鏈路208彼此連接。同時,圖2b示出包括圖2a的墊腳石交換機204和隧穿虛擬鏈路208重疊在圖2中所示的網絡200配置之上的分層級別,注意,墊腳石交換機可既用作常規交換機又用作墊腳石交換機,並且因此墊腳石交換機佔用兩個分層級別。
[0039]圖3和4分別示出使用常規網絡和採用墊腳石交換機辦法的網絡從源端點向目的地端點路由分組的比較。圖3的網絡IlOa和圖4的網絡200的所示網絡部分具有類似交換機和鏈路配置(不考慮墊腳石方面);在網絡200下,圖3的常規交換機29、30和31分別由墊腳石交換機SS3、SS4和SS5取代。對於每個網絡,分組從源計算機S發送給目的地計算機D。(為簡化起見,源計算機S與交換機29之間以及交換機19與目的地計算機D之間的任何網絡基礎設施未示出。)
[0040]假定網絡IlOa是IP網絡且實現TCP(傳輸控制協議)確認分組遞送,在圖3中所示的常規辦法下,第一分組使用TCP/IP協議沿包括交換機29、14、15、16、17、18和19的路徑發送。如圖所示,交換機18和19之間的跳躍具有X,指示分組已丟棄或丟失。在TCP/IP下,每個分組的成功傳輸通過從目的地向源返回確認消息(即ACK分組)來確認。如果在預定超時時段內沒有接收到給定分組的ACK消息,則源計算機的網絡接口和/或網絡軟體假定該分組已丟棄,並且重傳該分組。重傳的分組可能沿與丟失的分組相同的路逕行進,或者其可能在不同路徑上行進。圖3示出了使用不同路徑的示例,其中丟棄分組的副本沿包括交換機19、22、30、20、31、28和19的第二路徑(以虛線示出)重發,隨之該第二分組被轉發給目的地計算機D。
[0041]作為比較,網絡架構200下在源計算機S與目的地計算機D之間的分組路由採用墊腳石辦法。更詳細而言,源計算機S與目的地計算機D之間的路由路徑包括分別位於墊腳石SS3與SS4之間、以及墊腳石SS4與SS5之間的兩條子路徑400和402。子路徑400包括從墊腳石SS3至交換機19、隨後至交換機22、並且至墊腳石SS4的路由路徑。子路徑402包括從墊腳石SS4至交換機20、隨後至墊腳石SS5的路由路徑。每條子路徑400和402還包括墊腳石端點之間的虛擬隧道。一旦分組抵達墊腳石SS5,則其沿下一跳轉發至交換機19,交換機19隨後將該分組轉發至目的地計算機D。
[0042]詳述墊腳石服務的各個方面的示例在圖5a、5b和5c中描繪,且由網絡交換機實現的相應操作和邏輯在圖6的流程圖600中示出。如圖5a中所示,源計算機S與目的地計算機D之間的路由路徑500包括耦合在源計算機S和交換機1、交換機2、墊腳石SS1、交換機
3、交換機4、墊腳石SS2、交換機5、墊腳石SS3、交換機6、和目的地計算機D之間的鏈路。
[0043]參照圖5B和流程圖600,傳輸過程始於從源計算機S向交換機I傳送分組502。如框602中所描繪的,將分組從前一跳或起始點(在此情形中為源計算機S,其作為源端點操作)轉發至下一跳(交換機I)。如分組細節中所示,分組502的原始配置包括原始網絡轉發協議報頭504繼之以分組有效載荷506,報頭504包括原始源地址(即,源計算機S的地址)和原始目的地地址(即,目的地計算機D的地址)。將理解,該示例中所示的分組格式被一般化以應用於多種類型的網絡協議,並且實際分組的配置將遵循用於給定網絡所採用的任何適用協議的格式化。作為示例而非限定,原始協議報頭可包括IP報頭、乙太網報頭、Infiniband報頭等。另外,儘管僅示出單個報頭,但原始網絡協議報頭504可包括多個協議報頭(例如,TCP報頭和IP報頭)。此外,未示出較低級報頭,諸如MAC(媒體接入信道)報頭,但是應注意,聯網領域的技術人員將理解此類報頭的使用。
[0044]在判決框604中,確定當前交換機(交換機I)是否為墊腳石交換機。(根據該示例,該網絡中的交換機可以是常規(即,非墊腳石)交換機或墊腳石交換機)。由於交換機I是常規交換機,因此對判決框604的回答為「否」,並且流程圖前進至框606,其中執行常規轉發操作。如眾所周知的,此舉包括使用適用的查找值(諸如分組分類結果,例如使用目的地地址過濾器或對IP報頭的5元組散列)在該交換機的轉發表中執行查找以標識用於沿將到達目的地地址所標識的端點的路線將該分組轉發給下一跳的埠。另外,如果交換機I是邊緣交換機,則其可進一步配置成對分組502進行分類(未示出分類操作),以使得其被分類到採用墊腳石服務的話務類。在一些實施例中,邊緣交換機的轉發表包括偏好採用墊腳石服務的路線的轉發規則和/或過濾器。在其他實施例中,邊緣交換機可以不知曉墊腳石服務的存在。
[0045]更詳細而言,在所示實施例中,網絡是所管理網絡,其被配置成通過對適用話務類使用墊腳石交換機來促進對所管理流的使用。在此示例中,假定分組502屬於所管理話務類,並且由交換機I執行的轉發表查找標識出優選墊腳石路線可經由交換機2到達。因此,分組602從經由鏈路耦合到交換機2的交換機I中的埠轉發出去,並且流程圖邏輯返回框602,導致分組502被轉發給交換機2。取決於適用的協議,交換機I可以或者可以不對原始分組報頭504作出一些改變(諸如遞減IP分組的存活時間(TTL)倒計數);然而,原始源和目的地地址將保持不變。
[0046]繼續到分組502抵達交換機2,流程圖邏輯再次流經判決框604和框606,導致分組502從交換機2轉發給墊腳石交換機SSl,並且分組的原始源和目的地地址保持不變,如圖5b的頂部所描繪的。同前,交換機2的轉發表被配置成經由墊腳石轉發對應於某些分類(包括分組502的話務類)的分組。結果,耦合至交換機2與墊腳石SSl之間的鏈路的適用埠在框606中被交換機2選擇用於轉發該分組。
[0047]此時,分組502在墊腳石交換機SSl處被接收,並且流程圖邏輯已返回到判決框604。這次,對該判決框的回答為「是」,且該邏輯前進至框608,其中檢查分組報頭以確定該分組是否已從墊腳石轉發,其結果在判決框610中示出。在一個實施例中,確定分組已經由墊腳石轉發涉及以下邏輯。首先,確定分組的目的地地址是否對應於墊腳石的地址。如果為「是」,則檢查協議類型欄位(針對支持原型欄位的轉發協議)以確定協議類型是否為墊腳石隧道。如果是,則該分組已由墊腳石轉發,並且檢查源地址以標識經由其接收該分組的虛擬埠。本領域技術人員將認識到,所有分組將在物理埠上接收和發出,一些或所有物理埠可取決於它們是否被用於使用墊腳石子路徑來發送或接收分組而與虛擬埠相關聯。
[0048]返回到判決框610和圖5b中墊腳石SSl處的分組格式描繪,對判決框610的回答為「否」,並且該邏輯前進至框612,其中在墊腳石SS2的轉發表中進行查找以確定下一跳,用於沿基於當前目的地地址的轉發路徑將該分組轉發給下一跳。在圖5a中所示的示例中,分組沿墊腳石SSl和SS2之間的墊腳石子路徑501轉發。如以上所討論的,墊腳石埠是與墊腳石交換機上的物理埠相關聯的虛擬埠。如判決框614所描繪的,如果分組將經由墊腳石子路徑轉發給另一墊腳石,則轉發表查找將標識該分組會經由墊腳石虛擬埠轉發,從而導致「是」判決並且該邏輯前進至框616。
[0049]經由墊腳石子路徑的轉發經由使用墊腳石隧道報頭來採用可靠協議,墊腳石隧道報頭在一個實施例中如下生成並格式化。如框616中所不和圖5B中的分組508所描繪的,墊腳石交換機SSl前置墊腳石隧道報頭510,包括轉發協議報頭511和隧道報頭信息512。轉發協議報頭511包括與正用於在網絡中轉發該分組的轉發協議相對應的報頭。在本示例中,這是IP報頭,但不限於此。轉發協議報頭包括與當前墊腳石和下一墊腳石相對應的源和目的地地址,如由墊腳石SSl源地址和墊腳石SS2目的地地址所描繪的。在一些實施例中,轉發協議報頭還包括標識協議類型為墊腳石(SS)隧道的協議類型欄位。
[0050]隧道報頭信息512包括具有任選值的多個欄位(S卩,欄位值可為空)。在一個實施例中,每個轉發的分組包含隧道流序列號,連同一個或多個任選的墊腳石隧道報頭欄位。以下提供關於隧道流序列號和其他欄位的使用的更多細節。在一個實施例中,轉發協議報頭511包括前置報頭,而隧道報頭信息512包括新分組508的有效載荷的一部分,如經更新的有效載荷514所描繪的。如圖所示,經更新的分組有效載荷514 —般通過向原始分組502的數據內容前置隧道報頭信息512來生成。
[0051]返回框616,在生成並前置墊腳石隧道報頭以形成新分組508之後,當前墊腳石交換機(例如,SSD執行轉發表查找以確定採用哪個虛擬埠來轉發新分組,從而其將到達對應於下一墊腳石(例如,SS2)的地址的新分組目的地地址。
[0052]在一個實施例中,下一跳可根據指派給該分組的隧穿流來選擇。如圖5a中所示,墊腳石SSl和SS2之間存在多條可能的子路徑路線。例如,除了所選路線SSl — 3 — 4 — SS2以外,其他可能路線包括 SSl — 7 — 8 — SS2、SS1 — 3 — 8 — SS2、以及 SSl — 9 — 4 — SS2。此外,有可能實現更長路線,諸如SSl — 9 — 3 — 4 — SS2、SS1 — 3 — 9 — 4 — SS2等。
[0053]如以下更詳細地討論的,在一些實施例中,對應於給定的一對墊腳石交換機之間的大多數或所有分組的流可經由單條路徑來復用。任選地,對應於不同服務類的流可在不同路徑上復用。作為又一選項,可基於實時話務條件來創建或動態地重配置流路徑。
[0054]在一些實例中,分組可在沒有先前分類的情況下抵達第一墊腳石交換機。在一個實施例中,未分類分組由第一墊腳石基於一個或多個報頭欄位值進行分類。例如,分組可被分類成使用相關聯的服務類級別、或者作為與分類相關聯的流的一部分進行轉發。這種分類通常可應用於跨路由路徑中的所有交換機或僅墊腳石交換機的轉發操作。另外,還可在各對墊腳石交換機之間實現第二級分組分類,如以下更詳細地描述的。例如,分組可分類成各對墊腳石交換機之間的(子)流。
[0055]在確定虛擬(輸出)埠之後,該分組隨後根據框602經由與所標識的虛擬埠相關聯的物理輸出埠轉發至下一跳(交換機3)。繼續到判決框604以及圖5b中關於交換機3所示出的分組508配置,判決框604的結果為「否」,因為交換機3不是墊腳石交換機。同前,該分組隨後在框606中以常規方式被轉發。從交換機3 (以及其他非墊腳石交換機)的觀點而言,分組508看起來是具有正常轉發協議報頭(例如,在該示例中為正常IP報頭)、具有源地址和目的地地址連同各種其他欄位(出於清楚而未示出)的常規分組。分組508中的其餘數據(從常規交換機的角度而言)看起來是分組有效載荷,並且因此隧道報頭信息512被簡單地忽略。在本示例中,下一跳是交換機4,其以與交換機3類似的方式處理分組508,導致分組508被轉發給墊腳石SS2,墊腳石SS2是墊腳石子路徑501的目的地端點。
[0056]返回到判決框604並使分組配置前進至圖5c頂部,分組轉發序列的當前進展現在對應於墊腳石SS2從交換機4接收分組518。這導致對判決框604的「是」回答、以及對判決框610的「是」回答,因為轉發協議報頭511將墊腳石SS2標識為目的地地址且協議路線是墊腳石隧道。結果,該流程圖邏輯前進至框618,其中從該分組剝去墊腳石報頭(S卩,墊腳石報頭510)。該邏輯隨後前進至框612,其中確定用於下一跳的轉發埠。按照與分組抵達墊腳石SSl時類似的方式,該分組的轉發路徑的下一部分是經由墊腳石子路徑503,如圖5a中所示。該子路徑具有分別對應於墊腳石SS2和SS3的源和目的地端點。
[0057]同前,在框616中,通過前置墊腳石報頭518來形成新分組516,墊腳石報頭518包括具有對應於墊腳石交換機SS2和SS3的源和目的地地址的轉發協議報頭519、以及隧道報頭信息520,並且標識用於下一跳(在該實例中為交換機5)的虛擬埠。分組516隨後被轉發給交換機5,交換機5檢查轉發協議報頭519並將其識別為常規IP報頭,導致該分組被轉發給對應於分組516的目的地地址的墊腳石SS3。
[0058]繼續到圖5d頂部和判決框604,在此階段,由墊腳石SS3接收分組516。同前,墊腳石SS3檢查轉發協議報頭519並將分組516標識為經由虛擬埠接收自前一墊腳石。結果,該流程圖邏輯前進至框618,其剝去墊腳石隧道報頭518,留下原始分組502。該邏輯隨後前進至框612,以基於該分組的原始目的地地址(或者另行基於考慮該目的地地址的分組分類)執行在墊腳石SS3的轉發表中查找下一跳。這次,下一跳不涉及墊腳石子路徑的一部分,並且因此交換石SS3簡單地以常規方式經由所標識的物理埠轉發原始分組502以到達交換機6,如框620中的操作所描繪的。
[0059]此時,原始分組502到達交換機6,交換機6隨後以常規方式將該分組轉發給目的地計算機D,從而完成轉發序列。從目的地計算機D的觀點而言,原始分組502已簡單地以常規方式轉發,並且計算機D的聯網邏輯不知曉或甚至沒考慮實際路由路徑包括了一個或多個墊腳石子路徑。
[0060]流管理、復用和隧穿
[0061]根據一些實施例的附加方面,提供墊腳石交換機上的資源以促進墊腳石交換機對之間的隧穿子路徑上的流管理和話務復用。圖7a_7c中示出說明針對墊腳石子路徑實現的流管理、復用和隧穿的各方面的示例性配置。圖7a描繪了墊腳石SSl與SS2之間的子路徑,其經過一個或多個之間交換機700,如交換機I和2所描繪的。墊腳石SSl包括5個流隊列緩衝器FQ1-FQ5,並且墊腳石SS2包括6個流隊列緩衝器FQ1-FQ6。如圖7b中所示,墊腳石SSl與SS2之間存在數個所管理流,其中相應的分組被緩衝在所描繪的流隊列緩衝器中,並且其中線段的寬度被用於表示該流所消耗的相對帶寬部分。每個所管理流由線末端的緩衝器標識,例如流FQ1-FQ1、FQ1-FQ2、FQ3-FQ3等。還應注意,發送墊腳石上的流隊列與接收墊腳石上的流隊列之間不需要1:1關係。
[0062]如圖7c中所示,墊腳石SSl與SS2之間的各個流作為單個流隧穿通過中間交換機I和2。可任選地,這些流可使用多個隧道來傳送,這些隧道各自隧穿一組流。作為又一選項,所選流可使用經過其他中間交換機(未示出)的路線在一對墊腳石之間隧穿。
[0063]在一個實施例中,利用墊腳石的流按以下方式操作。分組使用包含諸如「當前墊腳石SS1」、「下一墊腳石SS2」和(那兩個墊腳石SS1-SS2之間的流的)序列號之類的信息的報頭從一個墊腳石隧穿至另一個墊腳石,如上所述。可任選地,報頭可包括該流的流Id和相關聯序列號。在一些實施例中,每個墊腳石保持某個數目的緩衝器用於流,潛在地具有正使用該墊腳石的服務的每個流(S(源)-D(目的地))都具有緩衝器池的粒度。出於簡化起見,將其描述為每一(S,D)對都具有單獨池,但是潛在地數個流可一起成塊地進入一個池,其缺點在於如果該池的所有緩衝器都充滿了,則該流的更多分組不能被該墊腳石接受。在一些實施例中,如果墊腳石不具有用於新流(或新類的流)的資源,則其針對某個流(新流,或者基於優先級或某個其他準則為現有流)放棄墊腳石服務。
[0064]墊腳石SS2針對使用從SSl到SS2的墊腳石服務的每個流類保持緩衝器池。I和2之間的中間交換機不知曉所有流在SSl與SS2之間復用。中間交換機可使用任一種傳統技術;它們可丟棄分組(在此情形中,墊腳石服務將仍是有益的,因為重傳將來自先前墊腳石而非完全來自源端點的),或者它們可以對SS1-SS2流進行回壓,這相比於傳統回壓將是有益的,因為將存在便宜的(非墊腳石)中間交換機能為墊腳石流保留緩衝器池的少數足夠的流。
[0065]利用該技術,在SS1-SS2墊腳石鏈路上復用的較慢流不會妨礙共享SS1-SS2鏈路的其他流的進度。由於墊腳石SSl和SS2具有足夠的緩衝器資源來保持用於(使用其服務的)大量流類的緩衝器,因此它們可針對這些流類中的每一者採用個體流管理技術。例如,在一個實施例中,實現基於信用的流控制方案,其中源墊腳石交換機(例如,SSl)不向目的地墊腳石(例如,SS2)發送該流類的分組,除非SSl知道SS2處存在用於該流類的緩衝器。在一個實施例中,可實現信用-流方案,其中發送墊腳石交換機將對應於給定流的分組樂觀地轉發給接收墊腳石交換機,接收墊腳石交換機將該分組緩衝在相應的流隊列中。如果該流隊列開始變滿,則接收墊腳石交換機可發送具有分配流信用準予的墊腳石報頭的分組,其實質上是說「你(發送方)被分配再發送η個分組,但在我向你發送另一流信用準予之前不能發送更多分組。」流信用準予的粒度(即,大小)可因實現參數而變化,諸如流的數量、話務量(相對於轉發吞吐量)、流的動態本質等。例如,可作出用於η個分組的給定流信用準予(例如,100個分組、1000個分組等)。
[0066]圖8示出可用來支持基於信用的流控制方案和以下描述的其他流控制方案的示例性墊腳石隧道報頭800。墊腳石報頭800包括轉發協議報頭802、隧道報頭信息欄位804、以及隧道報頭任選欄位806。如以上所討論的,轉發協議報頭將對應於用於在給定類型的網絡中轉發分組的類型的分組報頭,諸如但不限於用於採用基於IP的轉發的網絡的IP報頭。出於簡化起見,本文未提供個體類型的轉發協議報頭的細節,因為這些是本領域技術人員眾所周知的。示例性隧道報頭信息欄位包括隧道流序列號、任選的流ID和流序列號、ACK欄位位、信用欄位位、拒絕欄位位、暫停欄位位、以及恢復欄位位。這些欄位僅僅是示例性的,因為不同實施例可採用不同的、附加的、或更少類型的欄位。隧道報頭任選欄位806被用來描繪按照與其他網絡協議所使用的類似的方式將隧道報頭的一部分分配給一個或多個任選欄位。可任選地,針對隧道流信息欄位804描繪的一個或多個欄位可包括擴展欄位或伴隨欄位。例如,在現有的流信用準予場景中,該準予的分組數量可編碼在信用欄位中,其中非空值的存在指示分組報頭與流信用準予相關聯。可任選地,信用位可被用於指示隧道報頭的目的,並且該準予的分組數目可被包括在伴隨欄位(未示出)中或在對應於隧道報頭任選欄位806的分組部分中。
[0067]作為另一流控制選項,墊腳石SSl以循環方式輪流為每個流類發送分組。如果特定流類已超出其在墊腳石SS2處的配額,則SS2拒絕該分組,並且墊腳石SSl將在下一輪重傳它。墊腳石拒絕分組報頭800a的示例在圖8a中示出。在該實施例中,拒絕欄位位被設為T(如粗體拒絕所指示的),並且隧道報頭選項欄位被用於列出已被拒絕的分組的序列號(在該示例中為分組6、14、18和26)。響應於發送墊腳石得到關於已被拒絕的分組的序列號的通知,並且將嘗試重發那些分組。在一個實施例中,響應於接收到分組已被拒絕的通知,使用新的隧道流序列號來重發該分組。
[0068]作為使用常規循環方案的替換方案,可採用加權循環方案,其中在每一輪期間,所選流被分配附加分組。例如,消耗較高帶寬和/或具有較大(相對)緩衝器分配的流可每輪被分配多個分組,而較低帶寬/緩衝器流可被分配單個分組。當然,每輪分配給每個流的分組數量可以是某個數目m,而非一次分配單個分組(或m乘以加權值)。
[0069]作為另一選項,可實現暫停-恢復方案。在此辦法下,墊腳石SSl輪流(例如,循環或加權循環)為每個流傳送分組,並且如果特定流接近其配額,則SS2為那一個流發送「暫停」,並且SSl將在使用SS1-SS2隧道的其他流之間復用,直至SS2為SS2暫停了的流發送「恢復」。傳達暫停和恢復的報頭可具有與墊腳石隧道報頭800類似的配置,其中在適用的情況下暫停和恢復欄位位被置位。
[0070]信用或暫停-恢復辦法的一種替換辦法是採用樂觀式流管理,其中允許分組被丟棄。例如,針對給定流的緩衝器利用可能波動,導致在瞬間峰值負載的情況下分組被丟棄。在該樂觀式辦法下,分組被丟棄的頻率或百分比較低,並且因此損失的相關聯帶寬相對較低。該樂觀式辦法相對於信用或暫停-恢復辦法而言還可節省帶寬,因為從目的地墊腳石向源墊腳石發回的用於促進流管理的分組利用可減少。
[0071]採用流復用和隧穿的逐跳墊腳石服務的使用在適用話務條件下提供了顯著的性能優勢。例如,從中間交換機SI和S2的觀點而言,通過它們轉發的大部分或所有話務可被分類為單個流(即,流SS1-SS2)或少量流(具有不同服務類的SS1-SS2流)。結果,並非劃分可用緩衝器資源以支持相當大量的流,緩衝器資源可一起匯成池作為單個緩衝器或幾個緩衝器。此辦法的益處在於,交換機可更好地利用其緩衝器資源而不必丟棄分組或實現回壓操作來減少其緩衝器的填充水平。
[0072]結合前述流管理、復用、和隧穿辦法,墊腳石可個體地管理其流,其中在按需基礎上向所選流應用回壓以管理通過中間交換機的復用流的分組處理吞吐量。例如,儘管墊腳石SSl和SS2之間的交換機可能對SS1-SS2流進行流控制,但它們不需要用於每個復用流的資源;由SSl來公平地在復用流之間共享SS1-SS2隧道的帶寬。如果一個復用流較慢,則它不會妨礙其他復用流的進度;該單個(S,D)流可由墊腳石SS2回壓並由墊腳石SSl保持。
[0073]一些網絡協議共有的特徵是分組遞送驗證。如以上所討論的,在諸如TCP之類的協議中,遞送驗證是經由從目的地端點向源端點發回的ACK消息來促成的。同樣如以上所討論的,用於轉發沒有到達其目的地的分組的任何帶寬對於該分組在被丟棄或丟失之前經過的路線部分是有損失的。
[0074]通過使用墊腳石和隧穿鏈路促成的另一優勢在於與遞送確認有關的性能改善。如同諸如TCP之類的遞送確認協議一樣,如果墊腳石(例如,SSl和SS2)之間的交換機丟失分組(由於比特錯誤或由於擁塞丟失),則該分組由SSl (有效源端點)保持並由SSl重傳,直至SS2 (有效目的地端點)接受它。
[0075]在一些實施例中,遞送確認是經由墊腳石報頭中包含的信息來促成的。例如,墊腳石隧道報頭信息欄位804中的ACK欄位位可被用來確認對一個或多個分組的遞送,其中在伴隨欄位中或在隧道報頭任選欄位806中的欄位中提供該分組的序列號。另外,可通過使用流ID和流序列號在流基礎上實現遞送確認。
[0076]在一個實施例中,對復用流作為整體(例如,墊腳石之間的復用分組流)採用隧道流序列號。在此辦法的一個實施例中,當源墊腳石由於流的分組被拒絕而重傳流的分組時,它將與其首次被傳送時具有不同的序列號。例如,假設墊腳石SSl樂觀地輪流發送每個流的分組,而不知道墊腳石SS2是否將具有緩衝器空間用於該流。SS2發回ACK,其具有如「序列號17-37被接收和接受。序列號38被接收但沒有緩衝器空間用於該流。序列號39-51被接收和接受。序列號52看起來丟失。序列號53-57被接收和接受。序列號58被接收但沒有緩衝器空間用於該流」之類的信息。當對應於序列號38的分組被重傳時,用於該復用流的序列號可前進到比如說序列號79,在這種情形中,重傳的分組將具有序列號79。
[0077]除了前述流控制辦法,可實現其他流控制技術。例如,在一個實施例中,實現提前流控制。例如,SS2告知SSl 「直至我們之間的序列號17,我具有3個分組的空間用於流1、7個分組的空間用於流2、0個分組的空間用於流3……」。這種類型的信息可在墊腳石分組的有效載荷中傳達,其中報頭將標識該分組的目的(例如,提前流控制)。此外,還可實現混合辦法。例如,在一個實施例中,即使SS2沒有明確說存在用於該流的信用、或者如果SS2給SSl的上一個信用報告指示它將沒有緩衝器空間,也允許SSl向SS2發送。如果SSl是過度樂觀,則SS2將拒絕它。但是也有可能的是,在給定從SS2到SSl的信息有延遲的情況下,緩衝器空間可能是可用的。
[0078]如可以容易觀察到的,在與利用由墊腳石執行的遞送驗證的逐跳辦法相比時,在常規分組轉發下由於分組丟棄/丟失造成的帶寬損失減少。首先,考慮各對墊腳石之間的路徑包括隧穿子路徑。如果在墊腳石之間實現遞送驗證機制,則該路線中將需要重新經過(重發丟棄或丟失分組)的最長部分將在一對墊腳石之間。另外,由於墊腳石具有更大的緩衝器資源,因此分組丟棄的發生顯著減少。此外,在可由墊腳石實現的流管理和復用方案下,墊腳石之間的中間常規交換機上的分組/流管理負擔也可顯著減少,因為只需要管理單個或少數流。
[0079]墊腳石交換機的網絡拓撲發現和配置
[0080]部署採用墊腳石交換機的網絡的一方面是墊腳石交換機的網絡拓撲發現和相關聯配置。如以上所討論的,墊腳石交換機可在網絡架構中的兩個單獨分層級別處實現一第一級對應於用作常規交換機,而第二級對應於用作墊腳石交換機。根據這兩個級別處的各方面的實現,可採用各種技術來發現每一級別處的網絡拓撲並配置墊腳石交換機,以使得它知曉每一級別處的網絡拓撲。
[0081]在一個實施例中,使用常規技術(諸如經由一個或多個廣告方案或使用中央管理器等)來確定該網絡在這兩個分層級別中的每一級別處的節點和鏈路結構。例如,墊腳石交換機可使用鏈路狀態路由協議與對等交換機交換配置分組(由此向另一個交換機廣告其配置),其中這些交換機的鏈路和節點配置信息在該網絡中傳播。這是常規交換機用來確定網絡拓撲的技術,並且類似技術可由墊腳石交換機用來促成第一級別處的配置。鏈路狀態路由協議技術可被擴展成支持交換第二級別處的配置信息,由此使得墊腳石交換機的配置和能力可供其他墊腳石交換機使用。淨結果是,墊腳石具有該網絡架構在第一和第二分層級別中的每一級別處的「視圖」。
[0082]在一個實施例中,墊腳石交換機基於兩個分層級別處的網絡拓撲來構建和維護轉發表。例如,這可使用統一轉發表或針對每個級別的單獨轉發表來執行。通常情況下,如果實現為統一轉發表,則兩個分層級別的轉發數據可以在邏輯上分開。選擇使用哪個轉發表(或轉發表的部分)將基於是否將對給定分組使用墊腳石轉發。
[0083]示例性墊腳石交換機硬體架構
[0084]圖9和10分別示出說明在墊腳石交換機的一個實施例中採用的組件的交換機900和交換線路卡1000。交換機900包括底座902,其中多個交換線路卡1000安裝在相應的槽中。出於簡化起見,圖10中所示的交換線路卡1000被描繪為具有相同的配置;然而,本領域技術人員將認識到,在同一交換機底座中可採用具有不同配置的線路卡。
[0085]如圖10中所示,交換線路卡1000包括主板1002,其上經由插孔連接安裝或以其他方式耦合多個組件,包括一個或多個處理器1004和存儲器模塊1006。還示出耦合至主板1002的大容量存儲設備1008和子板1010。大容量存儲設備1008通常可包括硬碟驅動器或固態驅動器。子板1010例示各種類型的板或模塊,其可耦合至主板1002以提供輔助功能,並且是可任選的。主板1002進一步包括連接器1012,在交換線路卡安裝在其槽中時,連接器1012耦合至交換機底座902中的背板(未示出)。背板被配置成使得交換線路卡能與彼此以及與交換機中的其他設施通信。交換線路卡1000還包括用於耦合至網絡鏈路的各種連接器,諸如由RJ-45連接器1014和可任選的連接器1016和1018所描繪的。
[0086]本文所公開的墊腳石交換機的實施例所實現的操作和邏輯通常可經由指令(諸如軟體和/或固件指令)來實現、在處理器1004或交換線路卡1000上的其他處理組件或邏輯中的一者或多者上執行。在各種實施例中,處理器1004可包括通用處理器,包括單核和多核處理器,或者可包括專用處理器,諸如配置成使用流水線架構來促成分組處理的網絡處理器。
[0087]交換機900說明在大型網絡中實現的墊腳石的墊腳石交換機配置。然而,這不作為限定,因為具有更簡化配置的交換機裝置可實現在其他類型的網絡中,諸如乙太網區域網(LAN)和廣域網(WAN)。另外,墊腳石交換機可實現在其他類型的網絡中,包括但不限於Infiniband網絡、以及採用標準化或專有網絡協議的存儲網絡。例如,此類交換機裝置通常將包括類似於關於交換線路卡1000所示的組件,交換線路卡1000說明墊腳石交換機裝置的一個實施例。因此,獨立墊腳石交換機可包括主板,其上可安裝或以其他方式可操作地耦合各種組件,包括一個或多個處理器、存儲器、存儲設備、輸入和輸出埠,其中存儲設備存儲被配置成由一個或多個處理器執行以促成墊腳石操作的指令。
[0088]雖然參考特定實現方式描述了一些實施例,但根據一些實施例,其他實現方式也是可能的。另外,附圖中所示的和/或本文描述的元件或其它特徵的配置和/或順序不需要以所示和所描述的特定方式安排。根據某些實施例很多其它配置也是可能的。
[0089]在附圖中示出的每個系統中,在一些情況下的元件可分別具有相同附圖標記或不同的附圖標記,以暗示所表示的元件可能不同和/或相似。然而,元件是足夠靈活的以具有不同的實現並與本文所示或所描述的系統中的部分或全部一起操作。附圖中所示的各元件可以相同或不同。將哪個稱為第一元件以及將哪個稱為第二元件是任意的。
[0090]在說明書和權利要求書中,可使用術語「耦合」和「連接」及其衍生詞。應當理解,這些術語並不旨在作為彼此的同義詞。相反,在具體實施例中,「連接的」用於指示兩個或更多個要素彼此直接物理或電接觸。「耦合的」可表示兩個或更多個元件直接物理或電接觸。然而,「耦合的」也可表示兩個或更多個元件並未彼此直接接觸,但是仍然彼此協作、彼此相互作用。
[0091]實施例是本發明的實現或示例。說明書中對「實施例」、「一個實施例」、「一些實施例」或「其它實施例」的引用表示結合這些實施例描述的特定特徵、結構或特性被包括在本發明的至少一些實施例中,而不一定在所有的實施例中。各處出現的「實施例」、「一個實施例」或「一些實施例」不一定都指相同的實施例。
[0092]並非本文中描述和示出的所有組件、特徵、結構、特性等等都需要被包括在特定實施例或多個實施例中。例如,如果說明書陳述「可」、「可能」、「可以」或「能夠」包括組件、特徵、結構或特性,則不一定包括該特定組件、特徵、結構或特性。如果說明書或權利要求書提至IJ「一」或「一個」元件,則這並不意味著僅有一個該元件。如果說明書或權利要求書引用「附加」元素,則不排除有一個以上的附加元素。
[0093]如上所討論的,可通過對應軟體和/或固件組件及應用(諸如由網絡交換機上的處理器所執行的軟體或固件)來促成本文中實施例的各方面。因此,本發明的實施例可用作或支持在某種形式的處理核(諸如,計算機的CPU、多核處理器的一個或多個核)上執行的軟體程序、軟體模塊、固件和/或分布式軟體,在處理器或核上運行或以其它方式在機器可讀介質上或內實現或達成的虛擬機。機器可讀介質包括用於存儲或傳送機器(例如,計算機)可讀形式的信息的任何機制。例如,機器可讀介質可包括只讀存儲器(ROM)、隨機存取存儲器(RAM)、磁碟存儲介質、光存儲介質,以及快閃記憶體設備等。
[0094]以上對本發明的所示出實施例的描述,包括在摘要中所描述的,並非旨在是詳盡的或將本發明限於所公開的精確形式。儘管為了說明目的,本文描述了本發明的具體實施例以及示例,但是如相關領域技術人員所理解的,各種可能的等效修改也落在本發明的範圍內。
[0095]可以根據上面的詳細描述對本發明進行這些修改。所附權利要求中所使用的術語不應該被理解為將本發明限制於說明書和附圖中所公開的特定實施例。相反,本文的範圍完全由所附權利要求來確定,權利要求根據權利要求解釋的所建立原則來解釋。
【權利要求】
1.一種方法,包括: 在包括第一類型的交換機的第一交換機處接收具有原始格式的分組,所述原始格式包括對應於網絡轉發協議的原始分組報頭,所述原始分組報頭包括用於目的地端點設備的目的地地址,所述目的地端點設備通信地耦合至一包括多個第一類型的交換機和多個第二類型的交換機的網絡; 確定從第一交換機到所述目的地端點設備的路線,,所述路線通過第一交換機與包括第一類型的交換機的第二交換機之間的子路徑來轉發,所述子路徑包括所述第一和第二交換機之間的包括第二類型的交換機的至少一個中間交換機; 向所述原始分組格式前置第二分組報頭以形成新分組,所述第二分組報頭包括對應於第一交換機的地址的源地址和對應於第二交換機的地址的目的地地址,所述第二分組報頭具有對應於所述網絡轉發協議的格式;以及 經由耦合在第一交換機與沿所述子路徑的第一中間交換機之間的鏈路從第一交換機向第一中間交換機轉發所述新分組, 其中第一類型的交換機比第二類型的交換機具有更大的存儲器容量,並且第一類型的交換機採用促成第一類型的交換機之間的子路徑的錯誤恢復的可靠協議。
2.如權利要求1所述的方法,其特徵在於,第二分組報頭包括隧道報頭,所述隧道報頭包括含網絡轉發協議報頭的第一部分和含一個或多個報頭信息欄位的第二部分。
3.如權利要求2所述的方法,其特徵在於,所述一個或多個報頭信息欄位被包括在所述新分組的分組有效載荷中。
4.如權利要求1所述的方法,其特徵在於,還包括: 在第一交換機處接收多個分組; 將所述多個分組中的分組指派給相關聯的分組流,所述相關聯的分組流包括多個流類;以及 將與所述多個分組流相關聯的分組作為經由第一和第二交換機之間的所述子路徑隧穿的復用流進行轉發。
5.如權利要求4所述的方法,其特徵在於,還包括: 在第一交換機處接收來自第二交換機的與分組流相關聯的第一分組流信用準予;將對應於所述分組流信用準予且與所述分組流相關聯的數個分組經由所述子路徑從第一交換機轉發給第二交換機;以及 等待直至接收到與所述分組流相關聯的第二分組流信用準予後轉發與所述分組流相關聯的附加分組。
6.如權利要求4所述的方法,其特徵在於,還包括: 使用基於循環的方案從第一交換機經由所述子路徑向第二交換機發送分組,其中每個流類針對每一輪被分配一時機; 在第一交換機處接收來自第二交換機的關於給定流的分組已被拒絕的指示;以及 在所述給定流的後續時機期間重發被拒絕的分組。
7.如權利要求4所述的方法,其特徵在於,還包括: 使用基於循環的方案從第一交換機經由所述子路徑向第二交換機發送分組,其中每個流類針對每一輪被分配一時機; 在第一交換機處接收來自第二交換機的暫停請求,所述暫停請求用於請求暫停發送與所述暫停請求中所標識的流相對應的分組;以及 跳過所述暫停請求中所標識的流的時機,直至已從第二交換機接收到對所述流的恢復請求。
8.如權利要求4所述的方法,其特徵在於,還包括樂觀地從第一交換機經由所述隧穿子路徑向第二交換機轉發分組。
9.如權利要求4所述的方法,其特徵在於,還包括: 接收來自第二交換機的對個體流類實施回壓的指示;以及 在第一交換機處扼制所述個體流類的傳輸速率。
10.如權利要求1所述的方法,其特徵在於,第一和第二交換機被配置成促成確認分組遞送,所述方法還包括: 從第一交換機向第二交換機發送分組; 引發超時時段,在所述超時時段期間未在第一交換機處接收到指示所述分組已在第二交換機處被成功接收的ACK分組;以及 從第一交換機向第二交換機重發所述分組, 其中所述ACK分組包括報頭,所述報頭包括ACK標記。
11.如權利要求1所述的方法,其特徵在於,還包括: 從第一交換機向第二交換機發送分組序列; 在第一交換機處接收從第二交換機發送的單個分組,所述單個分組指示所述序列中被第二交換機拒絕的一個或多個分組的序列號;以及 用新序列號重發所述序列中被拒絕的所述一個或多個分組。
12.如權利要求1所述的方法,其特徵在於,還包括: 在第一交換機處接收已從第三交換機沿第二子路徑轉發給第一交換機的第二分組,所述分組包括被第三交換機所前置的隧道報頭,所述第三交換機包括第一類型的交換機;以及 從第二分組剝去所述隧道報頭。
13.如權利要求1所述的方法,其特徵在於,所述網絡轉發協議包括網際協議。
14.如權利要求1所述的方法,其特徵在於,所述網絡轉發協議包括乙太網協議。
15.如權利要求1所述的方法,其特徵在於,所述網絡轉發協議包括Infiniband協議。
16.一種交換機裝置,被配置成實現為網絡中的包括第一類型的交換機的第一交換機,所述網絡包括多個第一類型的交換機,所述多個第一類型的交換機穿插在多個不包括第一類型的交換機的諸個中間網絡元件之間,所述交換機裝置包括: 主板,具有操作地耦合到它的多個組件,包括 至少一個處理器; 存儲器; 多個輸入和輸出埠 ;以及 其中存儲有指令的至少一個存儲設備,所述指令被配置成由所述至少一個處理器執行以使得所述交換機裝置當在所述網絡中操作時執行操作,包括: 在輸入埠處接收具有包括第一分組報頭的原始格式的分組,所述第一分組報頭對應於由所述網絡採用的網絡轉發協議且包括與通信地耦合至所述網絡的目的地端點設備相對應的目的地地址; 確定從所述交換機裝置到所述目的地端點設備的通過所述交換機裝置與包括第一類型的交換機的第二交換機之間的子路徑轉發的路線,所述子路徑包括所述交換機裝置和第二交換機之間的至少一個中間網絡元件; 向所述原始分組格式前置第二分組報頭以形成新分組,所述第二網絡協議分組報頭包括對應於所述交換機裝置的地址的源地址,並包括對應於第二交換機的地址的目的地地址,其中所述第二分組報頭的格式的至少一部分對應於所述網絡轉發協議的分組報頭;以及 從所述交換機裝置經由輸出埠向沿所述子路徑的第一中間網 絡元件轉發所述新分組。
17.如權利要求16所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 在一個或多個輸入埠處接收多個分組; 將所述多個分組中的分組指派給相關聯的分組流,所述相關聯的分組流包括多個流類;以及 將與所述多個分組流相關聯的分組作為經由所述交換機裝置和第二交換機之間的所述子路徑所隧穿的復用流進行轉發。
18.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 接收來自第二交換機的與分組流相關聯的第一分組流信用準予; 將對應於所述分組流信用準予且與所述分組流相關聯的數個分組經由所述子路徑從所述交換機裝置轉發給第二交換機;以及 等待直至接收到與所述分組流相關聯的第二分組流信用準予後轉發與所述分組流相關聯的附加分組。
19.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 使用基於循環的方案經由所述子路徑向第二交換機發送分組,其中每個流類針對每一輪被分配一時機; 接收來自第二交換機的關於給定分組流的分組已被拒絕的指示;以及 在所述給定分組流的後續時機期間重發被拒絕的分組。
20.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 使用基於循環的方案經由所述子路徑向第二交換機發送分組,其中每個流類針對每一輪被分配一時機; 接收來自第二交換機的暫停請求,所述暫停請求用於請求暫停發送與所述暫停請求中所標識的流相對應的分組;以及 跳過所述暫停請求中所標識的分組流的時機,直至已從第二交換機接收到對所述分組流的恢復請求。
21.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括機樂觀地從所述交換機裝置經由所述隧穿子路徑向第二交換機轉發分組。
22.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 接收來自第二交換機的對個體流類實施回壓的指示;以及 在所述交換機裝置處扼制所述個體流類的傳輸速率。
23.如權利要求17所述的交換機裝置,其特徵在於,第二分組報頭包括隧道報頭,所述隧道報頭包括含網絡轉發協議報頭的第一部分以及含一個或多個報頭信息欄位的第二部分。
24.如權利要求23所述的交換機裝置,其特徵在於,所述交換機裝置和第二交換機被配置成促成確認分組遞送,且其中所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 經由所述子路徑向第二交換機發送分組; 引發超時時段,在所述超時時段期間未在所述交換機裝置處接收到指示所述分組已在第二交換機處被成功接收的ACK分組;以及 經由所述子路徑向第二交換機重發所述分組, 其中所述ACK分組包括隧道報頭,所述隧道報頭包括ACK標記。
25.如權利要求17所述的交換機裝置,其特徵在於,所述交換機裝置和第二交換機被配置成促成確認分組遞送,且其中所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 從所述交換機裝置向第二交換機發送分組序列; 在所述交換機裝置處接收從第二交換機發送的單個分組,所述單個分組指示所述序列中被第二交換機拒絕的一個或多個分組的序列號;以及 用新序列號重發所述序列中被拒絕的所述一個或多個分組。
26.如權利要求17所述的交換機裝置,其特徵在於,所述指令在由所述至少一個處理器執行時被配置成執行進一步操作,包括: 接收第二分組; 確定第二分組已從包括第一類型的交換機的第三交換機沿第二子路徑被轉發給所述交換機裝置,所述分組包括被第三交換機前置的隧道報頭;以及 從第二分組剝去所述隧道報頭。
27.—種網絡,包括經由多條鏈路互連的多個網絡交換機,所述網絡交換機包括多個第一類型的交換機,所述多個第一類型的交換機穿插在不是第一類型的交換機的諸個交換機之間,其中第一類型的交換機被配置成針對每一跳以帶有錯誤恢復的逐跳方式經由沿各對第一類型的交換機之間的隧穿子路徑的復用流來路由分組,其中所述隧穿子路徑包括經過各對第一類型的交換機之間的不包括第一類型的交換機的一個或多個交換機的路由路徑。
28.如權利要求27所述的網絡,其特徵在於,第一類型的交換機中的至少一部分被配置成對沿所選子路徑的所選分組流採用基於信用的流控制,其中對於基於信用的流,源第一類型的交換機除非接收到對流類的流信用準予否則不向目的地第一類型的交換機發送所述流類的分組。
29.如權利要求27所述的網絡,其特徵在於,第一類型的交換機中的至少一部分被配置成針對沿第一類型的交換機之間的子路徑所復用的一個或多個分組流促成暫停-恢復流管理方案。
30.如權利要求27所述的網絡,其特徵在於,第一類型的交換機中的至少一部分被配置成使用隧道消息中的確認標記來促成從包括第一類型的交換機的第一交換機經由子路徑發送給包括第一類型的交換機的第二交換機的分組的確認遞送。
【文檔編號】H04W40/12GK104205942SQ201380004571
【公開日】2014年12月10日 申請日期:2013年6月20日 優先權日:2012年11月19日
【發明者】R·帕爾曼 申請人:英特爾公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀