一種適用於千萬億次計算機機群的低功耗管理方法
2023-10-10 16:54:04 1
專利名稱:一種適用於千萬億次計算機機群的低功耗管理方法
技術領域:
本發明涉及一種對區域網中各節點能耗管理,更特別地說,是指一種適用於千萬 億次計算機對機群的低功耗管理方法。
背景技術:
隨著高性能計算的發展,器件功耗逐漸增加,在高密度計算的環境下,熱設計的難 度越來越高,功耗帶來的超級計算機或數據中心的運行成本日益高漲。很多大型機在設計 過程中已經把如何有效控制系統功耗作為一個設計原則。功耗控制是千萬高效能計算機設計中需要考慮的重要因素。機群系統的運行功耗在整個運行成本中站有相當比重,即使通過優化設計將峰值 功耗控制在較低水平上,其產生的費用也是相當驚人的;另一方面,對於千萬億次計算機這 種大規模系統來說,其滿負荷運行的時間在整個運行時間中所佔比例並不高,換句話說,相 當多的節點在很多時間處於空閒狀態。因此,在不影響性能的前提下,有效地降低系統運行 時的功耗,是非常重要的。由於在高性能計算中,對於每一個任務,不能準確估計其在某一個節點上的執行 時間長度,並且任務的到來只能通過統計方法給出一個大致分布,所以對於節點的空閒時 間與時刻不能進行有效估計。
發明內容
本發明的目的是提出一種適用於千萬億次計算機機群的低功耗管理方法,該方法 通過節點自身的休眠時間定製來實現各個節點的低功耗。在分析現有的低功耗管理/控制 的方法和策略的基礎上,設計系統級上有效降低千萬億高效能計算機運行能耗的策略和方 法。在此基礎上進行代碼的開發實現,為高效能計算機系統軟體的其他模塊提供功耗管理/ 控制接口,在保證千萬億次計算機運行效率的前提下,實現儘可能降低運行時能耗的目的。本發明機群的低功耗管理方法執行下列步驟步驟一開機後,通過伺服器向各節點發出節能尺度識,所有節點歸入可接受任務 集N= {ni,n2,……,~},可接受任務集N均可接受伺服器發送的任務;n表示可接受任務的節點;j表示可接受任務節點的個數;步驟二 伺服器將任務隊列A = {a」 a2,……,ak}中的任務按照到達順序分配給 N中的節點,並從N中剔除該節點;若任務隊列A中沒有任務可供分配,則不進行分配,直至任務到達;a表示任務隊列中的任務;k表示任務隊列中的任務個數;步驟三分配有任務的節點對接收到的任務進行執行,並將執行完成的結束時刻
3通知伺服器,並根據休眠關係
進行休眠;步驟四待休眠時間到達,該節點向伺服器發出一個可接近任務的信息,伺服器收 到該信息後,將此節點加入可接受任務的節點集N= {ni,n2,……,中。本發明低功耗管理方法具有如下優點(1)本發明通過改變傳統的以伺服器為主導的設計方案,將必要的休眠時間交由 節點支配;休眠期間伺服器不得向節點分配任務。因此該方法也是一種以節點節能為衡量 指標的方法。(2)本發明所採用的方法不需要對任務的分布有所了解,也不需要知道任務的執 行時間。方便管理與計算,同時省去伺服器用於統計及分析的時間與能量消耗。
圖1是機群系統結構示意圖。圖2A是有無管控機群在不同任務密度下的總執行時間對比。圖2B是有無管控機群在不同任務密度下的消耗能量對比。圖3A是有無管控機群在不同節點數量下的總運行時間對比。圖3B是有無管控機群在不同節點數量下的消耗能量對比。
具體實施例方式下面將結合附圖和實施例對本發明做進一步的詳細說明。在適用於千萬億次計算機機群中出於節能目的,不能將節點始終保持在運行狀 態;又由於節點由低能耗狀態轉入運行狀態需要消耗一定的能量,導致沒有目的的休眠節 點往往會產生更高的能耗。於是,欲達到節能目的,節點進入休眠狀態後,即要保持一定時間,再進行喚醒。本發明僅針對千萬億次計算機機群處於運行狀態和休眠狀態的模式進行分析。假設任意節點(任意一個千萬億次計算機)在運行狀態的功率為Pw,休眠狀態功 率為Ps,由休眠狀態轉入運行狀態需耗能記為3。對每一個節點賦一個節能尺度記為0。在此尺度下,每一個節點每次的休眠時長仁 都與前一次運行時長tw存在的休眠關係為
,即 本發明機群的低功耗管理方法執行下列步驟步驟一開機後,通過伺服器向各節點發出節能尺度0 ,所有節點歸入可接受任務 集N= {ni,n2,……,~},可接受任務集N均可接受伺服器發送的任務;n表示可接受任務的節點;j表示可接受任務節點的個數;步驟二 伺服器將任務隊列A = { ,a2,……,ak}中的任務按照到達順序分配給 N中的節點,並從N中剔除該節點;
4
若任務隊列A中沒有任務可供分配,則不進行分配,直至任務到達;a表示任務隊列中的任務;k表示任務隊列中的任務個數;步驟三分配有任務的節點對接收到的任務進行執行,並將執行完成的結束時刻 通知伺服器,並根據休眠關係^^^^^進行休眠;步驟四待休眠時間到達,該節點向伺服器發出一個可接近任務的信息,伺服器收 到該信息後,將此節點加入可接受任務的節點集N= {ni,n2,……,中。在不同任務密度下的千萬億次計算機機群系統的低功耗管理測試參見圖2A、圖2B所示,該圖為機群的節點數量設為128個,參加測試的任務量為 1000個。圖中分別對比了,任務密度為1、10、100、1000、10000等五個檔次的環境中,執行任 務需要花費的總時間和總消耗能量。此處的任務密度指的是任務平均執行時間與每兩個任 務到達時間差的比例。整個測試系統在IBM HS21刀片伺服器上進行搭建,測試過程中使用威格電子 GDW1200C型功率儀對整個系統的能耗進行測量。測試系統內的所有刀片上採用Red Hat Enterprise Linux 5. 0作業系統,並將內核升級至2. 6. 30版本。表1任務密度不同的機群系統執行時間及消耗能量對比 注無管控是指未運行本發明低功耗策略的千萬億次計算機構成的機群。使用管控是指運行本發明低功耗策略的千萬億次計算機構成的機群。如圖2A、圖2B及表1中所示,當任務密度在100以下時(此密度可以更高),使 用管控機群執行時間與無管控機群執行時間相同。而消耗能量方面,使用管控機群能耗比 例隨著任務密度增加而增加,當任務密度為1時,使用管控機群消耗能量為無管控機群的 20% ;但是,當任務密度大於100時,使用管控機群的任務執行時間有了非常大的損失。這 是因為,任務密度過大時,空閒時間則相應過短,運行本發明低功耗管理策略的節點仍然轉 入休眠狀態,從而延長了整個機群系統的總執行時間。在不同節點數量下的千萬億次計算機機群系統的低功耗管理測試參見圖3A、圖3B所示,固定任務數量為1000個,任務密度為100。圖中分別對比 了,機群節點數量為16、32、64、128、256等五個檔次的環境中機群執行任務需要花費的總 時間和總消耗能量。整個測試系統在IBM HS21刀片伺服器上進行搭建,測試過程中使用威格電子 GDW1200C型功率儀對整個系統的能耗進行測量。測試系統內的所有刀片上採用Red HatEnterprise Linux 5. 0作業系統,並將內核升級至2. 6. 30版本。
表2節點規模不同的機群系統的執行時間及消耗能量對比 注無管控是指未運行本發明低功耗策略的千萬億次計算機構成的機群。使用管控是指運行本發明低功耗策略的千萬億次計算機構成的機群。如圖3A、圖3B及表2中所示,使用管控機群任務執行時間及消耗能量比例隨著節 點規模的增加而減少。其中,消耗能量始終小於無管控機群消耗的能量。而執行時間,在機 群規模小於64時,有明顯延長。這是因為,節點數量少,而任務數量固定,則由本發明策略 決定的休眠次數增加,從而使伺服器任務隊列中的任務長時間等待分配。
權利要求
一種適用於千萬億次計算機機群的低功耗管理方法,其特徵在於低功耗管理執行下列步驟步驟一開機後,通過伺服器向各節點發出節能尺度所有節點歸入可接受任務集N={n1,n2,……,nj},可接受任務集N均可接受伺服器發送的任務;n表示可接受任務的節點;j表示可接受任務節點的個數;步驟二伺服器將任務隊列A={a1,a2,……,ak}中的任務按照到達順序分配給N中的節點,並從N中剔除該節點;若任務隊列A中沒有任務可供分配,則不進行分配,直至任務到達;a表示任務隊列中的任務;k表示任務隊列中的任務個數;步驟三分配有任務的節點對接收到的任務進行執行,並將執行完成的結束時刻通知伺服器,並根據休眠關係進行休眠;步驟四待休眠時間到達,該節點向伺服器發出一個可接近任務的信息,伺服器收到該信息後,將此節點加入可接受任務的節點集N={n1,n2,……,nj}中。FSA00000060926700011.tif,FSA00000060926700012.tif
2.根據權利要求1所述的適用於千萬億次計算機機群的低功耗管理方法,其特徵在 於僅針對千萬億次計算機機群處於運行狀態和休眠狀態的模式進行分析。
全文摘要
本發明公開了一種適用於千萬億次計算機機群的低功耗管理方法,該方法僅針對千萬億次計算機機群處於運行狀態和休眠狀態的模式進行分析。假設任意節點在運行狀態的功率為Pw,休眠狀態功率為Ps,由休眠狀態轉入運行狀態需耗能記為β。對每一個節點賦一個節能尺度記為在此尺度下,每一個節點每次的休眠時長tr都與前一次運行時長tw存在的休眠關係為待休眠時間到達,該節點向伺服器發出一個可接近任務的信息,伺服器收到該信息後,將此節點加入可接受任務的節點集N={n1,n2,……,nj}中。本發明方法通過節點自身的休眠時間定製來實現各個節點的低功耗,設計系統級上有效降低千萬億高效能計算機運行能耗的策略和方法,在保證千萬億次計算機運行效率的前提下,實現儘可能降低運行時能耗的目的。
文檔編號H04L29/06GK101847044SQ20101013093
公開日2010年9月29日 申請日期2010年3月22日 優先權日2010年3月22日
發明者劉軼, 彭緋, 錢德沛, 陳杰 申請人:北京航空航天大學