新四季網

數據中心的一種無損持續可擴展互聯結構的製作方法

2023-08-02 11:18:11 1

專利名稱:數據中心的一種無損持續可擴展互聯結構的製作方法
技術領域:
本發明屬於數據中心和雲計算領域,涉及數據中心的一種無損持續可擴展互聯結構及配套路由方法,使數據中心在不改變各個伺服器配置的前提下滿足持續可擴展性、無損可擴展性、高容錯性、以及高性價比等設計目標。
背景技術:
數據中心(data center)指用於集中安置計算機系統以及相關部件(伺服器,交換機等)的設施,並包含備用電源,電流傳輸設備,環境控制(如空調、滅火器等)和安全設備。隨著雲計算、物聯網等新型應用形態層出不窮,數據中心作為重要的支撐力量,逐步成為目前學術界和工業界關注的焦點。科學家們已經意識到,科學技術的進一步發展不是缺少數據,而是缺少存儲數據和分析數據的有效方法。目前一些國際知名網絡服務企業如美國谷歌、微軟、亞馬遜、中國騰迅、阿里巴巴等公司都陸續建立了大型數據中心用於存儲大規模數據,並利用分布式存儲和處理的強大功能,將數據及時高效的傳輸到全球各個用戶。 例如,谷歌公司擁有的30多個數據中心截止2006年已經有近450,000臺伺服器。在每個數據中心內部,大量伺服器和網絡設備通過特定的互聯結構實現互聯。與此同時,許多應用服務,如谷歌搜索等對伺服器間數據交換帶寬的要求越來越高。而數據中心的現有互聯結構是依靠交換機、核心交換機、核心路由器將伺服器連接起來構成的如圖1所示的樹型結構。樹型結構的高層核心交換機、核心路由器往往構成數據中心的流量瓶頸,而且其容錯性也不理想,容易出現單點故障。隨著數據中心規模的急劇擴大,這種樹型互聯結構越來越難以確保數據中心所追求的漸進可擴展、高容錯能力、高聚集帶寬等系統指標。為了能更好地實現數據中心所追求的設計指標,越來越多的新型互聯結構在近幾年被提了出來。這些互聯結構大致被分為兩類。第一類是以交換機為中心,其將眾多交換機互聯為不同於樹型結構的其它互聯結構,而每臺伺服器僅僅同一個交換機互聯,其中的互聯規則和路由規則全部由交換機來完成。例如!^at-Tree和VL2。第二類是以伺服器為中心的互聯結構,各交換機之間並不直接互聯,而伺服器之間以及伺服器和交換機之間依據特定互聯結構連接,其中互聯規則和路由規則主要由伺服器完成,例如DCell, FiConn 禾口 BCube0DCell利用低端交換機以及具有多個網絡適配器埠的大量伺服器通過迭代方式構造的層次式互聯結構,每個高層DCell通過一定數量的下層DCell之間的進一步互聯來構建,多個同層DCell之間彼此全連通。第零層的DCell是基本構建模塊,由一個η個埠的低端交換機及與其直接互聯的η個伺服器組成。圖2給出了一個兩層DCell的互聯結構。Dcell使用通用超級立方體(Generalized hypercube)互聯規則來連接大量伺服器和低端交換機,進而為數據中心構造出一種層次式互聯結構。具有多個網絡適配器埠的伺服器連接到多個層次的低端交換機,任何兩個伺服器之間沒有直接連接。圖3給出了一個兩層的BCube互聯結構。以伺服器為中心的互聯結構具有以下優點首先,伺服器的可編程能力要比交換機強,因而各類新型互聯結構的實現和部署更加靈活;其次,商用伺服器出廠時即可配備多個網絡適配器埠 NIC (Network Interface Card),通過這些網絡適配器埠實現伺服器之間的直接互聯能夠提高伺服器間端到端的吞吐量以及數據中心的抗單點失效能力;最後,以伺服器為中心的互聯結構只需採用低端交換機即可,無需同以交換機為中心的互聯結構一樣使用大量昂貴的高端交換設備,因此大大降低了數據中心的硬體成本。儘管目前提出的以伺服器為中心的解決方案具備上述優點,但是存在如下兩個方面的問題。(1)依託於數據中心的各類應用如何才能不因數據中心的規模擴展而受影響?這呼籲一種具有無損擴展能力的數據中心互聯結構,在其規模擴展的過程中不對現有的結構產生任何調整,或者儘量少的調整,包括現有的每臺伺服器、交換機、以及每條布線。DCell 和BCube這兩種互聯結構每擴展一層會導致每臺伺服器額外增加一個網絡適配器埠,並且要在所有伺服器上增加新的物理連線,各類應用因此而受影響。儘管每臺伺服器額外增加一個網絡適配器埠的硬體成本並不很高,但是要為幾萬甚至幾十萬臺伺服器逐一新增一個網絡適配器埠和一條物理連線所耗費的人力和時間成本非常昂貴。此外,這項工作的操作非常複雜,極易出現不易排除的物理布線錯誤。綜合考慮,應該為數據中心的伺服器配備固定數目的網絡適配器埠,避免在投入使用之後因數據中心規模擴展而不斷擴充網絡適配器埠造成的諸多不良後果。從進一步降低硬體和配線的成本的角度考慮,最好為每個伺服器配備兩個網絡適配器埠。(2)為了實現數據中心互聯結構的無損可擴展性,每臺伺服器配備固定數目的網絡適配器埠,此時數據中心的規模能否持續增長並從根源上保證數據中心的可擴展性? DCell和BCube的構造規則決定了對應數據中心的最大規模已被其伺服器的網絡適配器埠數目所限定,從而不具備持續可擴展能力。事實上,DCell和BCube的規模之所以能持續快速增加的根源正在於其為每臺伺服器不斷追加新的網絡適配器埠和物理連線。如果 DCell和BCube的每個伺服器僅僅配備兩個網絡適配器埠,則其數據中心的規模非常有限從而無法滿足十萬級甚至百萬級伺服器規模的應用需求。不難發現,對於Dcell和BCube等現有的以伺服器為中心的互聯結構而言,其無損可擴展性和持續可擴展性是一對矛盾的設計指標,無法同時實現。即,為了確保無損可擴展性要求每臺伺服器配備固定數目的網絡適配器埠,如此則無法確保其持續可擴展性;為了確保持續可擴展性要求每臺伺服器不斷追加新的網絡適配器埠,如此則無法確保其無損可擴展性。

發明內容
鑑於上述分析,本發明為數據中心提出一種常量度數互聯結構DCube,其將配備兩個網絡適配器埠的伺服器和低端交換機高效互聯,在不改變各個伺服器配置的前提下確保數據中心具備持續可擴展能力、無損可擴展能力、高容錯能力、以及高性價比等設計目標。本發明首先採用非正則混合圖的方法來確保數據中心的無損和持續可擴展性。在設計數據中心的常量度數互聯結構的過程中,逐一提出其互聯結構的構造方法、簡單易行的單播單徑數據傳輸方法、以及並行高效的單播多徑數據傳輸方法。儘管本發明只關注伺服器配備兩個網絡適配器接口時的互聯結構及其配套路由方法,但是相關方法經過簡單調整後適用於伺服器配備更多固定數目網絡適配器接口的場景。
本發明是按照如下技術方案實現的一種數據中心的無損持續可擴展網際網路,該互聯結構基於非正則混合圖構建而得,其中所述互聯結構由至少一個基本單元構成,所述的一個基本單元包括η臺伺服器和一個具有η個接口的交換機,所述的每一臺伺服器均配備有兩個網絡適配器埠,其中第一個網絡適配器埠連接到所述的交換機,第二個網絡適配器埠預留用來支持擴展互聯。上述的無損持續可擴展網際網路,其中所述的互聯結構由一組所述的基本單元依據全連通規則構造成為一個一層的互聯結構,一組所述的一層互聯結構可以進一步根據全連通規則構造成為一個二層的互聯結構。依此類推,上述的無損持續可擴展網際網路可以進一步擴展為h層,具體層數h的取值決定於數據中心容納的伺服器數目N以及交換機的埠數目η。一種無損持續可擴展數據中心的網際網路構建方法,其中按照下述步驟構造可擴展互聯結構(1. 1)獲取用戶關於數據中心規模N、各個交換機的埠數目η、以及數據中心的層數h等基本配置請求,並按照後續過程構造無損持續可擴展互聯結構DCube (n,h);其中 η代表每臺交換機的埠數目或者每臺交換機連接的伺服器數目,而h代表DCube的層數, DCube (η, 0)為第0層互聯結構,是一臺交換機及其直接連接的η個伺服器所組成的最小構成模塊;(1. 2)為每臺伺服器賦予一個長度為h+Ι的標識符XhXlri. . . X1Xtl,其中1彡Xi彡η 而0彡i彡h ;(1. 3)為每臺交換機賦予一個標識符XhXlri. . . X1,其中1彡Xi彡η而1彡i彡h ;(1. 4)將標識符具有公共前綴長度為h的η個伺服器採用其第一個網絡適配器埠同標識符為其公共前綴的交換機直接互聯,形成一系列最小構成模塊DCube (η, 0);(1. 5)在標識符為src = XhXlri. . . X1X0和徹=<的兩臺伺服器之間通過其第二個網絡適配器埠直接互聯,僅當存在某個KjSa使得節點src的標識符滿足 Xj φ Xj-!且A-i = Xj-2 = ... = & = Xtl,其中Xjj表示j個連續的\ ;至此構成無損持續可擴展互聯結構DCube (n,h)。上述的數據中心的無損持續可擴展互聯結構的單播單徑路由的路徑建立方法(2. 1)接收用戶的數據傳輸請求,判斷數據傳輸的源伺服器和目的伺服器的標識符 src 禾口 dst ;(2. 2)判斷src和dst是否處於同一個最小的構造模塊內,如果屬實,則判定二者可以通過共同連接的交換機完成數據報文轉發工作;否則,確定用於連接src和dst所在的兩個不同DCube (n,h_l)之間的唯一連接邊 (nl,n2),(2. 3)然後遞歸調用步驟(2. 2),計算出從伺服器src到伺服器nl的路徑head以及從伺服器n2到伺服器dst的路徑tail ;輸出head+(η 1,n2)+tail作為從伺服器src到伺服器dst的路徑。上述的單播單徑路由路徑的數據傳輸方法,其進一步包括如下數據傳輸步驟(3. 1)源節點從獲得的最短路徑中選擇下一跳伺服器,並通過查詢本地路由表將數據從正確的網絡適配器埠轉發出去;(3. 2)處於該最短路徑中的各個中間交換機通過查詢本地路由表,將數據從正確的埠轉發給最短路徑中的下一跳伺服器;(3. 3)處於該最短路徑中的各個中間伺服器通過查詢本地路由表,將數據從正確的網絡適配器埠轉發給最短路徑中的下一跳伺服器,直至數據被轉發到目的伺服器;其中通過兩個通過第二個網絡適配器埠之間相連的伺服器之間的數據轉發稱之為一跳,或者兩個通過共同連接的交換機實現的伺服器之間的數據轉發也記為一跳。上述的數據中心的無損持續可擴展互聯結構的單播多徑路由的路徑建立方法(4. 1)接收用戶的數據傳輸請求,判斷數據傳輸的源伺服器和目的伺服器的標識符 src 禾口 dst ;(4. 2)判斷src和dst是否處於同一個最小的構造模塊內,如果屬實,則判定二者可以通過共同連接的交換機完成數據報文轉發工作;否則,確定用於連接src和dst所在的兩個不同DCube (n,h_l)之間的唯一連接邊 (nl,n2),(4. 3)然後遞歸調用步驟(4. 2),計算出從伺服器src到伺服器nl的路徑head以及從伺服器n2到伺服器dst的路徑tail ;輸出head+fcl,n2)+tail作為從伺服器src到伺服器dst的最短路徑;(4. 4)令src和dst標識符的最大公共前綴的長度為j,令i = h+1-j ;標識符為 Z = zh. . . Z1Z0的伺服器被選定為伺服器src的備選伺服器,僅當Z的標識符中滿足ζ"與 Si^1和dH不相等,而備選伺服器標識符的其餘部分與src對應部分一致;(4.5)循環執行步驟(4. 1)至步驟3),構建一條從源伺服器src到中間伺服器 Z的最短路徑、以及一條從中間伺服器Z到目的伺服器dst最短路徑,這兩條路徑銜接之後即形成一條從伺服器src到伺服器dst的額外路徑;(4. 6)重複執行步驟(4. 5)以從伺服器src到伺服器dst之間構建額外的n_2條平行路徑。上述的單播多徑路由路徑的數據傳輸方法,其進一步包括如下數據傳輸步驟(5. 1)源節點從獲得的n-1條平行路徑中分別選擇對應的下一跳伺服器,並通過查詢本地路由表將數據從正確的網絡適配器埠轉發出去;(5. 2)處於這n-1條平行路徑中的各個中間交換機通過查詢本地路由表,將數據從正確的埠轉發給各條平行路徑中的下一跳伺服器;(5. 3)處於這n-1條平行路徑中的各個中間伺服器通過查詢本地路由表,將數據從正確的適配器埠轉發給各條平行路徑中的下一跳伺服器,直至數據被轉發到目的伺服器;其中通過兩個通過第二個網絡適配器埠之間相連的伺服器之間的數據轉發稱之為一跳,或者兩個通過共同連接的交換機實現的伺服器之間的數據轉發也記為一跳。與現有技術相比,本發明具有以下優點1.確保數據中心具有無損可擴展能力本發明提出基於非正則混合圖的互聯結構DCube要求每臺伺服器配備固定數目的網絡適配器埠(比如兩個),避免在投入使用後因數據中心規模擴展而不斷擴充每臺伺服器的網絡適配器埠,進而不會對運行在數據中心上的應用系統產生影響。此外,本發明能確保DCube互聯結構在向更高一層擴展時僅僅需要在現有互聯結構中的n-1個伺服器上增加一條對外的連線即可,大量現有伺服器不受互聯結構規模擴展的影響,因此具有無損可擴展性。2.確保數據中心具有持續可擴展能力本發明提出基於非正則混合圖的互聯結構DCube構造方法能夠確保,任何層次的 DCube互聯結構中總是自動預留有η個伺服器各提供一個閒置的網絡適配器埠以支持向更高一層互聯結構擴展,因此具有持續可擴展。據此來看,本發明很好地解決了數據中心的現有互聯結構無法同時實現無損可擴展性和持續可擴展性這一難題。3.支持任意一對伺服器間的分布式最短路徑數據傳輸基於DCube互聯結構的構造規則,本發明為基於DCube構造的數據中心提出了高效的分布式單播單徑數據傳輸方法。令src和dst表示一對源伺服器和目的伺服器,單播單徑數據傳輸方法僅根據DCube的互聯規則以及源伺服器和目的伺服器的標識符就能快速推算出一條最短的數據傳輸路徑。因此,本發明對基於DCube的數據中心的單播數據傳輸提供了很好的支持,為各類數據中心應用在伺服器之間進行大數據量的遷移工作提高保障。4.支持任意一對伺服器間的分布式平行多徑數據傳輸在單播單徑數據傳輸方法的基礎上,本發明提出任意兩個伺服器之間的多徑平行數據傳輸方法,利用多徑傳輸效應可以大大提高數據中心中任意一對伺服器間的數據傳輸率。此外,任意兩個伺服器之間的某條傳輸路徑的失效並不影響其它平行路徑上的數據傳輸,因而可以在多個平行傳輸路徑間快速切換數據傳輸以提高數據傳輸的容錯能力。


圖1為本發明所述的一種不支持無損持續可擴展的基於樹型結構的數據中心;圖2為本發明所述的一種不支持無損持續可擴展的基於兩層DCell互聯結構的數據中心;圖3為本發明所述的一種不支持無損持續可擴展的基於兩層BCube互聯結構的數據中心;圖4為本發明所述的一種數據中心的無損持續可擴展網際網路中實施例1層次化互聯結構整體示意圖;圖5為本發明所述的一種數據中心的無損持續可擴展網際網路中實施例1伺服器網絡適配器埠為2時的數據中心互聯結構DCube 0,2);圖6為本發明所述的一種數據中心的無損持續可擴展網際網路中實施例1的單播單徑路由原理圖;圖7為本發明所述的一種數據中心的無損持續可擴展網際網路中實施例1的從伺服器111到444的單播單徑路由示意圖;圖8為本發明所述的一種數據中心的無損持續可擴展網際網路中實施例1的從伺服器111到444的單播多徑路由示意圖。
具體實施例方式下面結合附圖和實例對本發明作進一步詳細的說明。實施例1DCube 數據中心的一種無損持續可擴展互聯結構為了能更好地實現數據中心所追求的設計指標,學術界和工業界為大規模數據中心提出了一些新型互聯結構。如前所述,對於Dcell和BCube等現有的以伺服器為中心的數據中心互聯結構而言,其無損可擴展性和持續可擴展性是一對矛盾的設計指標,無法同時實現。即,為了確保無損可擴展性要求每臺伺服器配備固定數目的網絡適配器埠,如此則無法確保其持續可擴展性;為了確保持續可擴展性要求每臺伺服器不斷追加新的網絡適配器埠,如此則無法確保其無損可擴展性。具體而言,如圖2和圖3所示,DCell和BCube這兩種互聯結構不能解決數據中心的無損可擴展問題,因為Dcell和BCube等互聯結構每擴展一層都要在所有伺服器上增加新的NIC以及物理連線,並由此使得所有伺服器更新其路由表和路由策略,從而對各類應用在一定時間內產生很大影響。為實現數據中心互聯結構的無損可擴展性,每臺伺服器配備固定數目的網絡適配器埠。但是Dcell和BCube的構造規則決定了對應數據中心的最大規模已被其伺服器的網絡適配器埠數目所限定,從而不具備持續可擴展能力。從Dcell和BCube這兩種互聯結構中不難發現,層次網絡是構建大規模數據中心互聯結構的一種自然方式,許多底層基本網絡彼此互聯起來以構建上層網絡。每個底層網絡在結構上完全獨立自治且完好地支持局部通信,而上層網絡則在各底層網絡模塊間架設額外互聯鏈路從而支持遠程通信。從原理上來看,Dcell和Bcube均採用正則混合圖 (Complete Compound Graph)的設計思想通過迭代執行而構造出獨特的層次式互聯結構。 但是,基於正則混合圖的思想設計層次網絡時,網絡每擴展一層都必需為每臺伺服器增加一個額外的網絡適配器埠,因而無法滿足數據中心對無損和持續可擴展性的根本需求。鑑於上述分析,本發明提出非正則混合圖的設計思想為數據中心構建一種常量度數互聯結構Dcube,其將配備兩個網絡適配器埠的伺服器和低端交換機高效互聯,在不改變各個伺服器配置的前提下確保數據中心具備持續可擴展能力、無損可擴展能力、高容錯能力、以及高性價比等設計目標。正則混合圖和非正則混合圖的定義如下定義1給定兩個正則圖( 和G1,一個正則混合圖( (G1)採用一個G1圖來替換圖( 中的每個節點,圖&中每條連接邊被替換為兩個對應的G1之間的一條連接邊。G2的互聯結構被保留了下來,兩個G1之間只存在一個連接邊,而且每個節點具有相同的度。如果(;2是一個全連通圖,則用G(G1)來代表G(G1)。一層的正則混合圖能被進一步遞歸擴展到更高層的正則混合圖。為了便於解釋, 只考慮正則圖&是完全圖的情形。一個兩層正則混合圖G(G1)使用G(G1)作為一個基本模塊,並且使用一個全連通圖連接多個這樣的基本模塊。更一般地,一個第h層正則混合圖 Gh(G1)採用第(h-Ι)層正則圖Glri (G1)作為基本模塊,並採用一個全連通圖來連接多個這樣的基本模塊。定義2隻有在(;2的節點度和G1的網絡規模相同時,才能構建出一個正則混合圖。 當&的網絡規模大於(;2的節點度時,會產生一個非正則的混合圖。同理,非正則的混合圖也能通過遞歸方法不斷構造出更高層次的結構。兩層DCube互聯結構的基本構造方法令η代表每臺交換機的埠數目或者每臺交換機連接的伺服器數目,一臺具有η 個埠的交換機和η個各配備有兩個網絡適配器埠的伺服器構成了 DCube的最小構成模塊DCube (η, 0),其中每個伺服器均使用其第一個網絡適配器埠直接連接到該η個埠的交換機。如果令DCube (η,0)為定義1中的圖G1,令一個結點規模為η的全連通圖為定義1 中的&。在此可知,圖&的節點度為n-1,並且小於圖G1的伺服器規模,因而可運用非正則混合圖的設計思想在第零層DCube(n,0)互聯結構的基礎上構造第一層的DCube (n,l)互聯結構。具體而言,採用一個G1圖來替換圖( 中的每個節點,原來圖( 中的每條連接邊被替換為兩個對應的G1之間的一條連接邊。因為G1中存在η個伺服器而( 中的每個節點僅有 n-1條邊,不難發現此時存在&中的每個節點的連接邊不夠分配的問題,這導致在用G1替換完&中的每個節點後,DCube (η, 1)中存在η個DCube (η,0)構造模塊,但是每個DCube (η, 0)構造模塊均有一臺伺服器的第二個網絡適配器埠未被使用,即DCube(Iid)中尚有η個伺服器的第二個網絡適配器埠被預留用來支持更上層次的擴展。令DCube(n,l)為定義1中的圖G1,令一個結點規模為η的全連通圖為定義1中的 &。據此可以運用非正則混合圖的設計思想在第一層DCube(n,l)互聯結構的基礎上構造第二層的DCube (n,2)互聯結構。圖4描述了在三個不同層次上構建的新型互聯結構DCube,其中每臺伺服器配備有兩個網絡適配器埠,四個伺服器採用其第一個埠連接到一個具有4個埠的交換機,這一結構是數據中心的最小構成模塊,記為DCubd4,0)。將每個DCubd4,0)視為一個虛擬節點,4個這樣的虛擬節點被互聯為一個全連通圖,從而形成一個非正則混合圖 DCubd4,l),即全連通圖的節點度比DCubd4,0)的伺服器數目少1。每個虛擬節點內只有 3臺伺服器的第二個埠被使用,另一個伺服器的第二個埠被預留用來支持更上一層次的擴展。同樣當把每個DCube 0,1)視為一個虛擬節點時,4個這樣的虛擬節點形成一個非正則圖DCube 0,2)。不難發現,對於任意層次的互聯結構DCube (4,I1)(其中h > = 1)而言,其中總有4個伺服器的第二個埠一直留待構建更大規模的數據中心。圖5給出了圖4的整體效果,展示了如何從DCubd4,0)互聯結構逐步演變為 DCube (4,1)以及DCubd4,2)。在DCubd4,2)中,根據其互聯結構的構造規則預留111、 222、333、以及444的第二個網絡適配器埠以便向更高一層互聯結構DCubeGd)擴展。 不難發現,本發明能確保DCube互聯結構在向更高一層擴展時僅僅需要在現有互聯結構中的n-1個伺服器上增加一條對外的連線即可,大量現有伺服器不受互聯結構規模擴展的影響,因此具有無損可擴展性。此外,任何層次的DCube互聯結構中總是自動預留有η個伺服器各提供一個閒置的網絡適配器埠以支持向更高一層互聯結構擴展,因此具有持續可擴展。據此來看,本發明很好地解決了現有互聯結構無法同時實現無損可擴展性和持續可擴展性這一難題。多層DCube互聯結構的通用構造方法考慮到目前企業界建設的單個數據中心的伺服器規模已經達到幾十萬甚至上百萬,而且目前常用交換機的埠數目處於幾十個這樣的量級,因此兩層DCube互聯結構DCube (η, 2)可以支持的伺服器規模滿足不了實際應用需求。為此,本發明給出面向多層 DCube互聯結構的通用構造方法,使其可支持的伺服器規模不僅能夠滿足目前的數據中心規模需求,而且還可以持續擴展以滿足更大規模的數據中心需求。雖然在最小構成模塊 DCube (η, 0)的基礎可以繼續採用非正則混合圖的思想通過不斷遞歸構造出任意的第h層互聯結構DCube(n,h),但是構造的計算複雜度和時間延遲會隨著層數h的增加而增加。考慮到目前數據中心的伺服器規模已經達到幾十萬甚至上百萬,本發明提出的數據中心互聯結構的層數h會比較大,因而遞歸構造方法的計算和時間成本都會很大。為解決這一突出問題,本發明提出下述更加易於計算的互聯結構DCube (n,h)的構造方法,具體構造步驟如下所示。(1)令DCube (n,h)表示一個h層的DCube互聯結構,其中η代表每臺交換機的埠數目或者每臺交換機連接的伺服器數目,而h代表DCube的層數。DCube(n,0)代表最小構成模塊,即一臺交換機及其直接連接的η個伺服器。(2)為DCube (n, h)中的每臺伺服器賦予一個長度為h+Ι的標識符XhXlri. . . X1X0, 其中1彡XiSn而0彡i彡h。(3)為DCubefc,h)中的每臺交換機賦予一個標識符XhXlri. .. X1,其中1彡Xi彡η 而1彡i彡h。(4)標識符具有公共前綴長度為h的η個伺服器採用其第一個網絡適配器埠同標識符為其公共前綴的交換機直接互聯,從而形成一系列最小構成模塊。(5)在標識符為src = XhXlri. . . X1X0和徹=^^、+力—乂的兩臺伺服器之間通過其第二個網絡適配器埠直接互聯,僅當存在某個KjSa使得節點src的標識符滿足 Xj 乒 Xj-I 且 Xj-I = Xj-I = · · · = X1 = X。,其中 X 表示 j 個連續的 Xj。本發明依據上述步驟構建的DCubefc,h)能夠支持nh+1臺伺服器以及nh臺交換機的互聯,其中仍有η臺伺服器的第二個網絡適配器埠被保留用於網絡規模的進一步擴展,這些伺服器的標識符為知=Xlri = . . . =X1 = χ0,其中&為大於等於1而小於等於η 的任意整數。不難發現,一個DCube (n,h)互聯結構包含η個下一層的互聯結構DCube (n, h-1),而且每個DCube(n,h-l)之間僅有一條連接鏈路。一般意義上來看,一個DCube (n,h) 互聯結構包含個第i層的互聯結構DCube (n, i)。DCube的單播單徑數據傳輸方法數據中心支持的許多應用需要在伺服器之間進行大數據量的遷移工作。一個好的數據中心互聯結構應當對典型的數據傳輸模式給予很好的支持,一對一的單播傳輸是其中最基本的傳輸模式。本發明基於DCube互聯結構的構造規則,充分利用其互聯結構內在的層次性、對稱性以及模塊性等特徵,提出高效的分布式數據傳輸方法。令src和dst表示一對源伺服器和目的伺服器,單播單徑數據傳輸方法僅根據DCube的互聯規則以及源伺服器和目的伺服器的標識符就能快速推算出一條最短的數據傳輸路徑,因而源伺服器在發送數據報文之前就已獲知報文將要依次經過的伺服器和交換機的網絡地址信息。圖6給出了本發明的單播單徑數據傳輸方法原理圖。單播單徑數據傳輸的基本思想是,首先判斷src和dst是否處於同一個最小的構造模塊內,如果屬實,則判定二者可以通過共同連接的交換機完成數據報文轉發工作;否則,確定用於連接src和dst所在的兩個不同DCube(n,h-l)互聯結構之間的唯一連接邊(nl,n2),然後重複調用上述兩個步驟找到從伺服器src到伺服器nl的路徑以及從伺服器π2到伺服器dst的路徑。至此,從伺服器 src到伺服器dst之間的路徑便由兩條下一層的子路徑和(nl,M)連接邊組成。具體流程如方法1所示。
權利要求
1.一種數據中心的無損持續可擴展網際網路,該無損持續可擴展基於網絡的非正則混合圖互聯結構,其特徵在於所述互聯結構由至少一個基本單元構成,所述的一個基本單元包括η臺伺服器和一個具有η個接口的交換機,所述伺服器的每一個均配備有兩個網絡適配器,其中第一網絡適配器連接到交換機,第二網絡適配器接口預留用來支持擴展互聯。
2.如權利要求1所述的無損持續可擴展網際網路,其特徵在於其中所述的互聯結構由一組所述的基本單元依據全連通規則構造成為一個一層的互聯結構,進而由一組所述的一層互聯結構根據全連通規則構造成為一個二層的互聯結構。
3.如權利要求2所述的無損持續可擴展網際網路,其特徵在於由所述多個基本單元構成的互聯結構可以進一步擴展為h層,每個伺服器可配置多於兩個網絡適配器。
4.如權利要求1所述的無損持續可擴展網際網路,其特徵在於所述η為4,由4個基本單元構成一組,每個基本單元中的3個伺服器的第二網絡適配器接口分別與周圍的3個單元中的一個伺服器的第二網絡適配器接口相連接,進而形成一個一層的互聯結構,由4 個所述的一層互聯結構再互聯到一起所構成。
5.如權利要求4所述的無損持續可擴展網際網路,其特徵在於由所述多個基本單元構成的多個組組成的層可以進一步擴展為h層,每個伺服器可配置多於兩個網絡適配器。
6.一種數據中心的無損持續可擴展網際網路的網絡構建方法,該無損持續可擴展基於網絡的非正則混合圖互聯結構,其特徵在於按照下述步驟構造可擴展互聯結構(1. 1)獲取用戶關於數據中心規模N、各個交換機的埠數目η、以及數據中心的層數h等基本配置請求,並按照後續過程構造無損持續可擴展互聯結構DCube (n,h);其中η 代表每臺交換機的埠數目或者每臺交換機連接的伺服器數目,而h代表DCube的層數, DCube (η, 0)代表最小構成模塊,即一臺交換機及其直接連接的η個伺服器;(1. 2)為每臺伺服器賦予一個長度為h+Ι的標識符XhXlri. . . X1Xtl,其中1彡Xi彡η而 0彡i彡h ;(1. 3)為每臺交換機賦予一個標識符XhXlri. . . X1,其中1彡Xi彡η而1彡i彡h ;(1. 4)將標識符具有長度為h的公共前綴的η個伺服器採用其第一塊網絡適配器同標識符為其公共前綴的交換機直接互聯,形成一系列最小構成模塊DCube (η, 0);(1. 5)在標識符為src = XhXlri. . . 和徹= ..++*-,^的兩臺伺服器之間通過其第二塊網絡適配器直接互聯,僅當存在某個KjSa使得節點src的標識符滿足\ Φ Xjm 且^Cp1 = Xj_2 = ... = X1 = Xtl,其中χ/表示j個連續的\ ;至此構成無損持續可擴展互聯結構 DCube (η,h)。
7.一種基於權利要求1-5所述的數據中心的無損持續可擴展互聯結構的單播單徑路由的路徑建立方法(2. 1)接收用戶的數據傳輸請求,判斷數據傳輸的源伺服器和目的伺服器的標識符 src 禾口 dst ;(2. 2)判斷src和dst是否處於同一個最小的構造模塊內,如果屬實,則判定二者可以通過共同連接的交換機完成數據報文轉發工作;否則,確定用於連接src和dst所在的兩個不同DCube (n,h-l)之間的唯一連接邊(nl,n2),(2. 3)然後遞歸調用步驟(2. 2),計算出從伺服器src到伺服器nl的路徑head以及從伺服器n2到伺服器dst的路徑tail ;輸出head+(η 1,n2)+tail作為從伺服器src到伺服器dst的路徑。
8.一種基於如權利要求7所述的單播單徑路由路徑的數據傳輸方法,其進一步包括如下數據傳輸步驟(3. 1)源節點從獲得的最短路徑中選擇下一跳伺服器,並通過查詢本地路由表將數據從正確的網絡埠轉發出去;(3. 2)處於該最短路徑中的各個中間交換機通過查詢本地路由表,將數據從正確的埠轉發給最短路徑中的下一跳伺服器;(3. 3)處於該最短路徑中的各個中間伺服器通過查詢本地路由表,將數據從正確的埠轉發給最短路徑中的下一跳伺服器,直至數據被轉發到目的伺服器;其中通過兩個通過第二塊網絡適配器之間相連的伺服器之間的數據轉發稱之為一跳, 或者兩個通過共同連接的交換機實現的伺服器之間的數據轉發也記為一跳。
9.一種基於權利要求1-5所述的數據中心的無損持續可擴展互聯結構的單播多徑路由的路徑建立方法(4. 1)接收用戶的數據傳輸請求,判斷數據傳輸的源伺服器和目的伺服器的標識符 src 禾口 dst ;(4. 2)判斷src和dst是否處於同一個最小的構造模塊內,如果屬實,則判定二者可以通過共同連接的交換機完成數據報文轉發工作;否則,確定用於連接src和dst所在的兩個不同DCube (n,h-l)之間的唯一連接邊(nl,n2),(4. 3)然後遞歸調用步驟(4. 2),計算出從伺服器src到伺服器nl的路徑head以及從伺服器n2到伺服器dst的路徑tail ;輸出head+fcl,n2)+tail作為從伺服器src到伺服器dst的最短路徑;(4. 4)令src和dst標識符的最大公共前綴的長度為j,令i = h+1-j ;標識符為Z = Zh. . . Z1Z0的伺服器被選定為伺服器src的備選伺服器,僅當Z的標識符中滿足Zp1與Sp1和 Cli^1不相等,而備選伺服器標識符的其餘部分與src對應部分一致;(4. 5)循環執行步驟(4. 1)至步驟(4.幻,構建一條從源伺服器src到中間伺服器Z的最短路徑、以及一條從中間伺服器Z到目的伺服器dst最短路徑,這兩條路徑銜接之後即形成一條從伺服器src到伺服器dst的額外路徑;(4. 6)重複執行步驟(4. 5)以在伺服器src到伺服器dst之間構建額外的n_2條平行路徑。
10.一種基於如權利要求9所述的單播多徑路由路徑的數據傳輸方法,其進一步包括如下數據傳輸步驟(5. 1)源節點從獲得的n-1條平行路徑中分別選擇對應的下一跳伺服器,並通過查詢本地路由表將數據從正確的網絡埠轉發出去;(5. 2)處於這n-1條平行路徑中的各個中間交換機通過查詢本地路由表,將數據從正確的埠轉發給各條平行路徑中的下一跳伺服器;(5. 3)處於這n-1條平行路徑中的各個中間伺服器通過查詢本地路由表,將數據從正確的埠轉發給各條平行路徑中的下一跳伺服器,直至數據被轉發到目的伺服器;其中通過兩個通過第二塊網絡適配器之間相連的伺服器之間的數據轉發稱之為一跳, 或者兩個通過共同連接的交換機實現的伺服器之間的數據轉發也記為一跳。
全文摘要
本發明公開了一種用於數據中心的常量度數互聯結構,為大量具備兩個網絡適配器埠的普通伺服器和低端交換機提供具有無損和持續可擴展能力的互聯結構、簡單易行的單播單徑路由方法、以及並行高效的單播多徑路由方法。本發明是先根據數據中心的規模、交換機的埠數目、以及數據中心的層數等需求,完成各個伺服器以及交換機的互聯,形成無損持續可擴展的互聯結構;根據數據傳輸需求,識別目的伺服器地址,通過單播單徑路由方法產生完整的路徑,進而將數據傳輸到目的伺服器;根據數據傳輸需求,識別目的伺服器地址,通過單播多徑路由方法產生多條平行路徑,進而將數據沿多徑並行傳輸到目的伺服器。
文檔編號H04L29/08GK102510404SQ20111037055
公開日2012年6月20日 申請日期2011年11月21日 優先權日2011年11月21日
發明者劉俊先, 羅愛民, 羅雪山, 舒振, 郭得科, 陳洪輝, 陳濤, 黃力, 黃光奇 申請人:中國人民解放軍國防科學技術大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀