具備環面網絡的並行計算機系統上的故障恢復的製作方法
2023-06-23 23:08:01
專利名稱:具備環面網絡的並行計算機系統上的故障恢復的製作方法
技術領域:
本發明總體上涉及並行計算機系統中的故障恢復,更具體地說, 涉及一種用於從海量並行超級計算機中的環面網絡的故障部分實現故 障恢復的裝置。
背景技術:
高效故障恢復對於降低精密計算機系統的停機時間和修復成本 來說是很重要的。在具有大量運算節點的並行計算機系統上,單個元 件的故障可能會使計算機的大部分都不得不離線維修。
海量並行計算機系統是一種具有大量互聯運算節點的並行計算
機系統。這種海量並行計算機家族由國際商業機器公司(IBM)以Blue Gene為名開發出來。Blue Gene/L系統是一種可擴展系統,其中目前 運算節點的最大數目達到65536個。Blue Gene/L節點由帶有兩個CPU 和內存的單個ASIC (專用集成電路)組成。整個計算機被裝在64個 機架或機拒中,每個機架內有32個節點板。
Blue Gene/L超級計算機經由多個通信網絡進行通信。65536個 運算節點被布置成一個邏輯樹網絡和一個三維環面網絡。該邏輯樹網 絡把運算節點連接成樹結構,使每個節點與一個父節點和一個或兩個 子節點進行通信。環面網絡將運算節點邏輯連接成三維網格狀的結構, 其允許每個運算節點與計算機的一個扇區內其最近的6個相鄰節點進 行通信。由於運算節點被布置成需要與鄰近節點進行通信的環面網絡 和樹網絡,單個節點的硬體故障就可能使該系統的大部分停機,直至
故障硬體能夠得到修復。例如,單個節點故障或網絡連接可能導致計 算機系統的一個分區內的環面網絡的一個維度不可操作。另外,分配 給故障分區的所有硬體也可能需要離線,直至故障得以糾正。在具備環面網絡的現有技術系統上,單個節點或網絡連接的故障 往往需要計算機離線進行維修。當環面網絡發生了一個故障時,有利 的是能夠儘可能迅速有效地克服該故障。如果沒有更有效地克月良環面 網絡故障的手段,並行計算機系統將繼續浪費潛在的運算處理時間, 增加了操作和維護成本。
發明內容
根據優選的實施例,描述了一種用於克服並行計算機系統中環面 網絡故障的裝置和方法。當在環面網絡中出現故障時,計算機系統的
服務節點中的網狀(mesh)路由機構將節點由環面網絡配置成網狀網 絡。網狀路由機構利用了每個節點中的捷逕寄存器的優點,從而使經 由網絡傳輸的數據在各節點之間進行路由時不經過發生故障的節點或 網絡連接。
所述的例子和描述涉及了 Blue Gene結構,但是也可以擴展到具 有布置成網絡結構的多處理器的任何並行計算機系統,其中節點硬體 句柄使數據流從其它節點走捷徑通過。
前面所述的以及其它的特徵和優點將通過下面更加具體的描述 而變得更為清楚,如在附圖中所示。
下面將僅以示例方式參照附圖描述本發明的實施例,圖中 圖l是按照優選實施例的海量並行計算機系統的框圖; 圖2是示出了海量並行計算機系統中 一個運算節點的輸入和輸出 連接的框圖3是海量並行計算機系統中一個運算節點的框圖; 圖4是海量並行計算機系統中一個中間面的框圖; 圖5是示出了諸如海量並行計算機系統這樣的高度互聯的計算機 系統的一個分區的框圖6是與環面網絡相連的一系列節點的框圖;圖7是示出了利用捷逕寄存器對網絡數據流進行路由的節點通信 的一個例子的框圖8是示出了利用捷逕寄存器對網絡數據流進行路由的節點通信 的一個例子的另一個框圖;以及
圖9是利用捷逕寄存器對網絡數據流進行路由的方法流程圖。
具體實施例方式
的環面網絡故障的裝置和方法。計算機系統的服務節點中的網狀路由 機構利用每個節點中的捷逕寄存器而將節點由環面網絡配置成網狀網 絡,從而使傳輸的數據在各節點之間進行路由時繞過發生故障的節點 或網絡連接。將藉助國際商業機器公司(IBM )所開發的Blue Gene/L 海量並行計算機來描述優選的實施例。
圖1示出了代表諸如Blue Gene/L計算機系統這樣的海量並行計 算機系統100的框圖。Blue Gene/L系統是一種可擴展系統,其中最 大運算節點數目達到65536個。每個節點110具有一個專用集成電路 (ASIC) 112,也被稱為BlueGene/L運算晶片112,它結合了兩個處 理器或中央處理單元(CPU)。該節點通常還具有512兆字節的本地 內存(未示出)。用於兩個節點的運算晶片和內存被安裝在一個節點 運算卡114上。 一塊節點板120容納了 16個節點運算卡114,每個節 點運算卡具有兩個節點110。因而,每塊節點板有32個節點,每個節 點有兩個處理器,每個處理器都有相關聯的內存。機架130是包含連 接成兩個中間面132的32塊節點板120的機箱。各節點板120通過中 間板連接器134連接成一個中間面印刷電路板132。所述中間面132 位於機架內部,在圖1中沒有示出。完整的Blue Gene/L計算機系統 被裝在64個機架130或機拒中,每個機架或機櫃中有32塊節點板。 這樣,整個系統就有65536個節點和131072個CPU (64個機架x32 塊節點板x32個節點x2個CPU)。
Blue Gene/L計算機系統結構可描述為帶有I/O節點表面的運算節點內核,其中由每個帶有連接到服務節點140的I/O處理器170的 I/O節點處理與1024個運算節點110的通信。所述1/0節點不具有本 地存儲器。I/O節點通過邏輯樹網絡連接到運算節點,並且還具有經 由功能網絡(未示出)實現的功能性廣域網絡性能。該功能網絡連接 到位於處理從服務節點140到多個節點的通信的節點板120上的I/O 處理器(或者Blue Gene/L連結晶片)170。 Blue Gene/L系統在連接 到一塊節點板120的I/O板(未示出)上具有一個或多個1/0處理器 170。這些I/O處理器可以;故配置為與8、 32或64個節點進行通信。 與1/0節點的連接和與運算節點的連接類似,只是i/o節點並沒有連 接到環面網絡。
再次參照圖1,計算機系統100包括用軟體處理節點加載並控制 整個系統操作的服務節點140。服務節點140通常是諸如IBM pSeries 伺服器這樣的迷你計算機系統,其上運行Liniix並帶有控制臺(未示 出)。服務節點140通過控制系統網絡150連接到運算節點110的機 架130。所述控制系統網絡為Blue Gene/L系統提供控制、測試和建 立基礎架構。控制系統網絡150包括不同的網絡接口,為海量並行計 算機系統提供必要的通信。下面進一步描述這些網絡接口。
服務節點140管理專用於系統管理的控制系統網絡150。控制系 統網絡150包括連接到位於節點板120上的Ido晶片180的私有 100-Mb/s乙太網,其處理從服務節點140到多個節點的通信。這種網 絡有時被稱為JTAG網絡,因為它使用JTAG協議進行通信。節點板 120上運算節點110的所有控制、測試和建立均通過與該服務節點通 信的JTAG埠來管理。另外,服務節點140包括網狀路由機構142, 當在環面網絡中存在故障時,該網狀路由機構將環面網絡配置成網狀 網絡。該網狀路由機構向節點中的捷逕寄存器分配值,從而繞過環面 網絡中的故障對節點數據流進行路由。該網狀路由機構142包括服務 節點140中的軟體,但是也可以由系統節點上執行的作業系統軟體來 輔助。
Blue Gene/L超級計算機經由多個通信網絡進行通信。圖2示出了表明Blue Gene/L計算機系統上的一個運算節點的I/O連接的框圖。 65536個運算節點和1024個I/O處理器170被布置成一個邏輯樹網絡 和一個邏輯三維環面網絡。所述環面網絡把運算節點邏輯連接成網格 狀的結構,其允許每個運算節點110與其最近的6個相鄰節點通信。 在圖2中,所述環面網絡通過X+、 X-、 Y+、 Y-、 Z+和Z-網絡連接來 表示,這些網絡連接把該節點連接到六個分別鄰近的節點。所述樹網 絡在圖2中通過樹0、樹1和樹2連接來表示。連接到該節點的其他 通信網絡包括JTAG網絡和全局中斷網絡。JTAG網絡提供用於從服 務節點140經由圖1所示的控制系統網絡150進行測試和控制的通信。 全局中斷網絡被用於實現用於運算節點上的類似處理的同步的軟體屏 蔽,以便當某任務完成時移動到處理的不同階段。因而全局中斷網絡 可以用於啟動、停止和暫停在節點的一個分區上運行的應用程式。此 外,還有針對每個運算節點110的時鐘和電源信號。
Blue Gene/L環面網絡以邏輯三維笛卡兒陣列把每個節點連接到 它的六個最近的相鄰節點(X+、 X-、 Y+、 Y-、 Z+、 Z-)。與六個相 鄰節點的連接在節點層面和中間面層面上完成。每個中間面是一個 8x8x8節點陣列。中間面中該節點陣列的六個面(X+、 X-、 Y+、 Y-、 Z+、 Z-)在大小上都是8H8-64個節點。來自這六個面中每個面上的 64個節點的每個環面網絡信號均通過連接到該中間面的連結卡(未示 出)淨皮傳送到鄰近中間面中的相應節點。每個面的信號也可以當該中 間面在一個分區中以任意維度上的一個中間面深度械 使用時被路由回 同 一 中間面在反面的輸入。
圖3示出了 Blue Gene/L計算機系統中一個運算節點110的框圖。 該運算節點110具有一個節點運算晶片112,該節點運算晶片有兩個 處理單元310A、 310B。每個處理單元310都有一個處理內核312。這 些處理單元310被連接到三級存儲高速緩存(L3高速緩存)320,並 連接到靜態隨機存取存儲器(SRAM)內存條330。來自L3高速緩存 320的數據通過DDR內存控制器350被載入到雙數據速率(DDR)同 步動態隨機存取存儲器(SDRAM) 340的內存卡中。
8再次參照圖3, SRAM內存330連接到JTAG接口 326,該JTAG 接口離開運算晶片112向Ido晶片180通信。服務節點經由乙太網鏈 路通過Ido晶片180與運算節點進行通信,所述乙太網鏈路是控制系 統網絡150 (上面已參照圖l進行了描述)的一部分。在BlueGene/L 系統中,每塊節點板120有一個Ido晶片,其它Ido晶片在每個中間 面132的板上(圖1) 。 Ido晶片經由可信的私有100Mbit/s乙太網控 制網絡使用未經處理的UDP數據包從服務節點接收指令。Ido晶片支 持與運算節點進行通信的多種串行協議。JTAG協議被用於從服務節 點140 (圖1)讀取和寫入到運算節點110中的SRAM 330的^f壬意地 址,並被用於系統初始化和引導過程。
圖3所示的節點運算晶片112還包括網絡硬體390。所述網絡硬 件390包括用於環面網絡392、樹網絡394和全局中斷網絡396的硬 件。如上面簡要描述的,Blue Gene/L的這些網絡,皮用來使一個運算 節點110與系統中的其它節點進行通信。網絡硬體390允許該運算節 點經由環面網絡接收和繼續傳遞數據包。網絡硬體390獨立地處理網 絡數據流,從而使得運算節點的處理器不會由於在環面網絡上流過的 數據量而加重負擔。
如圖3中所示,SRAM330包括一個屬性335。在引導過程期間, 服務節點把對於一個單個節點特定的信息包存在該屬性中。該屬性包 括針對作為環面網絡硬體392 —部分的X+、 X-、 Y+、 Y-、 Z+和Z-捷逕寄存器398的捷徑數據336 (下面將進一步描述)。當該節點被 初始化時,初始化軟體使用該屬性335中的捷徑數據336對捷逕寄存 器398進行配置。服務節點可改變X、 Y、 Z捷徑數據336,並指示該 節點更新捷逕寄存器398。在現有技術中,捷逕寄存器被用來將環面 網絡變成更適於某些類型的計算機應用的網狀網絡。捷逕寄存器的特 徵由網狀路由機構142(圖1)以一種新穎的方式使用,以克服節點故 障或網絡故障,這在下面還要進一步描述。
圖4示出了 BG/L計算機系統的中間面132。如上所述,每個節 點機拒被分成兩個中間面。每個中間面連接到環面網絡中它的六個鄰近的相鄰節點,用從中間面132的每個面出發的箭頭來表示。除了每 個帶有32個BG/L運算節點的16塊節點卡之外,每個中間面包括四 塊連結卡410,每塊連結卡上有六個連結晶片510 (未示出),每個中 間面總共有24個連結晶片。在中間面的邊界處,所有BG/L網絡都經 過一個連結晶片。該連結晶片有兩個功能。首先,它經由中間面之間 的線纜再次驅動信號,在不同中間面上的運算ASIC之間的長的有損 跡線-電纜-跡線(traceBcableBtrace)連接的中間處恢復高速信號波 形和振幅。其次,該連結晶片可以在其不同的埠之間重定向信號。 這種重定向功能允許BG/L被劃分成多個邏輯上分開的系統。
再次參照圖4,每個中間面與環面網絡上其6個相鄰的中間面進 行通信。與6個相鄰中間面的連接通過其相對於該中間面的笛卡爾坐 標來表示,因此位於所示的X+、 X-、 Y+、 Y-、 Z+和Z-方向上。另夕卜, 在X軸上還有一組被稱為X分路線纜(split cable)(未示出)的附 加連接。X分路線纜包括X+分路線纜和X-分路線纜。X分路線纜通 過提供用於連接X維度上的環面網絡的附加路由提供了一種增強分區 功能性的途徑。在BG/L系統中,連結卡具有多個連結晶片(未示出), 其支持環面網絡信號從一個中間面到下一個中間面的路由。這種路由 由主機在創建分區時設定,並保持不變直到另 一個分區被創建或被重 新配置。每個連結晶片埠支持21個差分對(16個數據信號, 一個 傳感信號用來避免未加電的晶片被來自線纜另 一端的驅動器輸出所驅 動, 一個備用信號, 一個奇偶信號,以及兩個異步全局中斷信號)。
BG/L環面互聯要求一個節點連接到邏輯三維笛卡爾陣列中它的 六個最近的相鄰節點(X+、 X-、 Y+、 Y-、 Z+, ZO 。與這六個相鄰 節點的連接在節點層面和中間面層面完成。每個中間面是一個8x8x8 節點陣列。中間面中該節點陣列的六個面(X+、 X-、 Y+、 Y-、 Z+、 Z-)的大小都是8H8-64個節點。來自這六個面中每個面上的64個節 點的每個環面網絡信號均通過連結晶片被傳送到鄰近中間面中的相應 節點。每個面的信號也可以當該中間面在一個分區中以任意維度上的 一個中間面深度被使用時4皮路由回同 一 中間面在反面的輸入。每個連結晶片埠服務於16個單向環面鏈路,使用經過每個埠的21對數 據信號進出該中間面。每個中間面由24個連結晶片來支持,每個連結 晶片有兩個埠,每個埠上有16個數據信號。這樣,帶有64個節 點的六個面需要由24個連結晶片上的2個埠所提供的384個輸入數 據信號和384個輸出數據信號,每個埠支持16個數據信號(對於輸 入有16x24=384個,對於輸出也有384個)。
圖5示出了諸如Blue Gene/L計算機系統這樣的海量並行計算機 系統的機架510A-510H的一個集合500,帶有中間面512A —512P, 其被設置在X維度上的一個分區中。機架510A-510H中的每一個均 代表圖1中所示的一個才幾架130,中間面512A - 512P中的每一個也 是圖1中所示的中間面132。每個中間面512A - 512P被布置成把節 點連接為一個8x8x8的環面,這裡該環面的坐標為X、 Y和Z。每個 機架^皮布置成8x8x16的環面,因為每個機架的兩個中間面在Z維度 上布置。第一個機架510A是機架0 (RO),有兩個中間面ROO 512 和R01514。類似地,機架R1有兩個中間面R10 521C和R11512D。 其餘的中間面512C - 512P類似地在機架R2至4幾架R7中淨皮編號為 R20至R71。在所示的分區中,X線纜520連接X維度上的8個機架, 而Y和Z維度在一個單個中間面中被巻繞起來,意味著機架在Y和Z 維度上的面上的節點被連接回同一機架背面上的節點,以形成環面。 X分路線纜在這個例子中沒有示出。因而,圖5所示的分區是一個 128x8x8的環面。可以看到,X維度線纜520通過遵循X線纜進入一 個機架、然後離開該機架進入下一個機架的方向以RO、 Rl、 R3、 R5、 R7、 R6、 R4、 R2的順序連接各4幾架。
圖6示出了在諸如Blue Gene/L計算機系統這樣的海量並行計算 機系統的一個分區中通過環面網絡612所連接的節點110的一個集合 600。圖6示出了圖5所示系統中連接成環面的節點的邏輯表示。節點 數可根據該分區內所包含的機架數目而變動,如通過最後一個節點 614中的可變數目N所表示的。在這裡的圖示中,X+維度是從左至右 的,而X-維度是從右至左的。圖6所示的邏輯表示僅代表布置在X維度上的節點。環面網絡的其它維度以相同的方式布置。上面所述的網
狀路由機構142可以把圖6所示的環面網絡變換成網狀網絡,其大體 上是一個開放的環面,或者是使節點在一個或多個維度上線性連接的 網絡。網狀路由機構142能夠通過使所有環面數據流離開故障位置路 由而克服一個節點內的故障或節點之間的連接故障。
對於環面(X+、 X-、 Y+、 Y-、 Z+、 Z-)內的每一個方向,在每 個節點中都有一個專門的寄存器,被稱為捷逕寄存器398,如前面參 照圖3所討論的。通過使用所述捷逕寄存器告訴節點如果路由網絡數 據流,網狀路由機構對網絡數據流進行路由,使其不經過節點內的故 障或網絡連接故障。如下面所述,為捷逕寄存器分配一個值,以在網 狀網絡上路由數據,使其不經過引起環面網絡故障的故障節點或網絡。 在現有技術中,通過把X+維度上的捷徑設置為x維度上的節點數並把 X-維度上的捷徑設置為零,從而把環面編程為網狀。與之不同的是, 這裡所公開的網狀路由機構對捷逕寄存器進行設置,使得任何發生故 障的節點和/或網絡從環面中被排除,剩下的網狀網絡仍然可用。
通過並行計算機系統的故障檢測硬體和軟體向網狀路由機構給 出發生故障的節點或網絡的位置。隨後網狀路由機構確定如何分配捷 逕寄存器以在開放環面(網狀網絡)上對數據進行路由,使數據不經 過發生故障的節點和/或發生故障的網絡連接。如何分配捷逕寄存器的 一個例子將在下面描述。捷逕寄存器的值隨後作為捷徑數據被載入到 如上面參照圖3所述的節點的屬性中。當節點被重設時,則節點重設 軟體利用來自節點屬性的捷徑數據來設置捷逕寄存器。隨後該網狀網 絡可以由 一個被初始化為在該並行計算機系統上運行的應用程式所使 用。
所述捷逕寄存器中的每一個由網狀路由機構(圖1中用142表示) 分別分配一個值,用來繞過故障節點路由數據。當環面網絡中存在中 斷時,兩個節點間的中斷將位於網絡中 一個節點的X+鏈路上和下一個 節點的X-鏈路上。網狀路由機構可以通過下述方式分配每個捷逕寄存 器以繞過故障節點進行路由
12break—plus是X+鏈路中斷的節點; break—minus是X-鏈路中斷的節點;並且
node—coord是針對所確定的捷逕寄存器的節點從0到N的值(對 應於NodeO至NodeN);
如果(node—coord <= break一plus) 則分配x-cutoff-0,且
x+ cutoff = break一plus;
否則
A酉己x-cutoff = break—minus, JL x+ cutoff = X維度上的最大節點 通過如上所述分配捷逕寄存器,採用下述方法路由數據使其繞過 網絡中的故障節點。
當在環面網絡上發送一個數據包時,發送節點和目的地節點的坐 標與捷逕寄存器結合使用,以根據下述方法判斷X維度上的哪個方向 發送該數據包。對於Y和Z維度使用類似的方法。 在x維度上
如果(發送節點 > 目的地節點)〃這暗示著X-方向
且如果(目的地節點 >=針對x-方向的捷徑)在X-方向上發送
否則在X+方向上發送
如果(發送節點 < 目的地節點)〃這暗示著X+方向
且如果(目的地節點 <=針對x+方向的捷徑)在X+方向上發
送
否則在X-方向上發送
現在將參照圖7描述利用網狀路由機構克服缺陷的一個例子。圖 7示出了與圖6所示類似的一組節點711-715的邏輯表示。每個節點 711 — 715通過環面網絡716連接到它在X維度上的兩個相鄰節點。此 外,每個節點711-715具有一個X-捷逕寄存器718和一個X+捷逕寄 存器720。這些寄存器中每一個的內容都在括號中示出。對於圖7所 示的例子,假定在環面網絡中存在一處中斷,如網絡中的鏈路720在節點1712和節點2 713之間斷開。如上面所述分配捷逕寄存器中的值。 對於這個例子,由於網絡中的中斷是在節點1的X+ —側,因而 break—plus為Al"。類似地,由於網絡中的中斷是在節點2的X-—側, 目而break minus 為A2"。對於小於或等於break—plus的節點(節點 0和節點1為<=1), x- cutoff被設置為A0", x+ cutoff被設置為Al"。 類似地,對於大於break—plus的節點,X- cutoff被設置為A2", X+ cutoff被設置為X(4)中的最大節點。
再次參照圖7,現在如圖7所示和上面所述為捷逕寄存器分配了 值,現在假定節點2 713需要向節點1 712發送數據,並把這一場景應 用於上面的方法。由於發送節點大於目的地節點,這意味著將在X-方向上進行發送,除非有例外情況。由於目的地節點(1)並不大於或 等於X-cutoff (0),出現了例外,因而在X+方向上發送。類似地,假 定節點4 715需要向節點2 712發送數據並應用該方法。由於發送節點 (節點5)大於目的地節點(節點2),意味著將在X-方向上進行發 送。由於目的地節點(節點2)等於cutoff(2),在X-方向上發送。這 樣,該環面已經形成了在節點1 712和節點2 713之間的連接處環面"開 放"的網狀。
現在將參照圖8描述克服故障的另一個例子。圖8示出了與圖7 類似的通過環面網絡816連接起來的一組節點811-815的邏輯表示。 每個節點811 - 815具有一個X-捷逕寄存器818和一個X+捷逕寄存器 820。這些寄存器中每一個的內容都在括號中示出。對於這個例子,假 定在環面網絡中在節點3 814和節點4 815之間存在一處中斷810。如 上面所述分配捷逕寄存器中的值。對於這個例子,由於網絡中的中斷 是在節點3的X+—側,因而break_plus為A3"。類似地,由於網絡 中的中斷是在節點4的X-—側,因而break_miiius為A4"。對於小於 或等於break_plus的節點(節點0至節點3為<=3 ) , x- cutoff被設 置為A0", x+ cutoff被設置為A3"。類似地,對於大於break_plus 的節點(節點4 ) , X- cutoff被設置為A4", X+ cutoff被設置為X(4) 中的最大節點。再次參照圖8,現在如圖8所示和上面所述為捷逕寄存器分配了值,現在假定節點2需要向節點l發送數據,並把這一場景應用於上面的方法。由於發送節點大於目的地節點,這意味著將在X-方向上進行發送,除非有例外情況。由於目的地節點(1)大於或等於X-cutoff(0),在X-方向上發送。類似地,假定節點4 815需要向節點2 812發送數據並應用該方法。由於發送節點(節點4)大於目的地節點(節點2),意味著將在X-方向上進行發送。由於目的地節點(節點2)並不小於或等於cutoff (4),在X+方向上發送。
圖9示出了網狀路由機構142繞過並行計算機網絡上發生故障的節點或網絡連接進行路由的方法900。首先,檢測出節點和/或環面網絡連接中的故障(步驟910)。接著,確定捷逕寄存器的值,以繞過發生故障的節點或網絡連接進行路由(步驟920)。然後,用新的值來設置捷逕寄存器(步驟930)。然後,重設硬體並重新把應用軟體加載到分區上(步驟940)。然後結束該方法。
這裡公開的內容包括用於克服並行計算機網絡中的環面網絡故障的方法和裝置。所述網狀路由機構利用了每個節點中的捷逕寄存器的優點,以在節點之間路由數據使其繞過故障節點或網絡連接進行傳輸,從而減少了停機時間,提高了計算機系統的效率。
本領域技術人員將會意識到,可以在要求保護的範圍內作出許多改動。因而,儘管在上面具體示出和描述了公開內容,但本領域技術人員應當理解,其中在形式和細節上可以做出這些和其它的改動,而不會背離要求保護的主旨和範圍。
權利要求
1.一種並行計算機系統,包括通過環面網絡連接的多個互聯的運算節點;以及網狀路由機構,當所述環面網絡中的鏈路中出現故障時,所述網狀路由機構把所述環面網絡轉換成網狀網絡。
2. 根據權利要求1的並行計算機系統,還包括在X維度上針對每個運算節點的x-捷逕寄存器和x+捷逕寄存器,並且其中所述網狀路由機構與環面網絡中的故障相關地為所述x-捷逕寄存器和x+捷逕寄存器中的每一個分配值,以使運算節點不經過所述故障而與網狀網絡中的相鄰節點進行通信。
3. 根據權利要求1或權利要求2的並行計算機系統,其中所述網狀路由機構位於該計算機系統的 一個服務節點中。
4. 根據以上權利要求中任一項的並行計算機系統,其中所述運算節點通過所述環面網絡互聯,使每個節點與它在三個維度上的六個最近的相鄰節點相連接。
5. 根據權利要求4的並行計算機系統,還包括分別在Y和Z維度上的Y+、 Y-、 Z+和Z-捷逕寄存器。
6. 根據以上權利要求中任一項的並行計算機系統,其中該計算機系統是海量並行計算機系統。
7. 用於並行計算機系統中的故障恢復的通過計算機實現的方法,其中該方法包括以下步驟檢測使多個運算節點互聯的環面網絡中的故障;確定所述並行計算機系統的所述多個運算節點中的捷逕寄存器的值以避開所述故障;把新的值設置在所述捷逕寄存器中;並且用所述捷逕寄存器中的新的值重新設置硬體和軟體以便在所述環面網絡上對數據進行路由以避開所述故障。
8. 根據權利要求7的通過計算機實現的方法,其中確定捷逕寄存器的值的步驟通過該計算機系統的一個服務節點中的網狀路由機構來執行。
9. 根據權利要求7或權利要求8的通過計算機實現的方法,其中所述運算節點通過所述環面網絡互聯,使每個節點與它在三個維度上的六個最近的相鄰節點相連接。
10. 根據權利要求9的通過計算機實現的方法,還包括分別在X、 Y和Z維度上的X+、 X-、 Y+、 Y-、 Z+和Z-捷逕寄存器。
11 根據權利要求7至10中任一項的通過計算機實現的方法,其中該計算機系統是海量並行計算機系統。
12. —種製造產品,包括將並行計算機系統中的多個運算節點連接起來的環面網絡;網狀路由機構,當出現故障時,所述網狀路由機構把所述環面網絡轉換成網狀網絡,以使所述環面網絡開放;以及承載所述網狀路由機構的計算機可記錄介質。
13. 根據權利要求12的製造產品,其中所述網狀路由機構與環面網絡中的故障相關地為所述多個運算節點中的每個運算節點中的針對X維度上的x-捷逕寄存器和x+捷逕寄存器分配值,以使運算節點不經過所迷故障而與網狀網絡中的相鄰節點進行通信。
14. 根據權利要求12或權利要求13的製造產品,其中所述網狀路由機構位於該計算機系統的一個服務節點中。
15. 根據權利要求12至14中任一項的製造產品,其中該計算機系統是海量並行計算機系統。
16. 根據權利要求13的製造產品,其中對於每個運算節點還包括分別位於Y和Z維度上的y+捷逕寄存器、y-捷逕寄存器、z+捷逕寄存器和z-捷逕寄存器。
17. —種電腦程式,包括當所述程序在計算機上運行時適於執行權利要求7至11中的所有步驟地程序代碼裝置。
全文摘要
用於克服並行計算機系統中的環面網絡故障的裝置和方法。當環面網絡中出現故障時,位於該計算機系統的服務節點中的網狀路由機構把節點從環面配置成網狀。該網狀路由機構利用了每個節點中的捷逕寄存器的優點,在節點間進行數據路由,使數據繞過故障節點或網絡連接傳輸。
文檔編號G06F11/00GK101657796SQ200880012261
公開日2010年2月24日 申請日期2008年3月20日 優先權日2007年4月18日
發明者A·塞德爾尼克, A·彼得斯, D·達靈頓, P·J·麥卡斯 申請人:國際商業機器公司