基於熱負載均衡的數據中心自適應性耗能管理方法
2023-09-23 18:33:45 1
基於熱負載均衡的數據中心自適應性耗能管理方法
【專利摘要】本發明公開一種基於熱負載均衡的數據中心自適應性耗能管理方法,在每個採樣時間內,採用以下步驟進行耗能管理:1)使用RLS模型估算伺服器的功耗;2)在約束條件下對費用函數進行優化求解,得出最優的Up(k);3)從Up(k)中選出第一組輸入U(k|k)作為真實的控制量U(k);4)計算需要的活躍伺服器個數mj;5)平均分配任務到每個機架。本發明方法,能夠動態地分配伺服器任務,使數據中心中伺服器和冷卻系統的總功率消耗降低。
【專利說明】基於熱負載均衡的數據中心自適應性耗能管理方法
【技術領域】
[0001] 本發明涉及網絡數據中心的耗能管理,更具體的說,涉及一種基於熱負載均衡的 數據中心自適應性耗能管理方法。
【背景技術】
[0002] 最近幾年,隨著雲計算的蓬勃發展。網絡數據中心,作為其基礎設施,承載著大量 的計算、存儲和應用等任務,需要消耗大量的能量來運行和冷卻設備。隨著雲計算服務發展 的越來越迅速,數據中心中的能耗越來越大。
[0003] 數據中心中的伺服器,作為處理和存儲用戶任務請求的所在,需要使用大量的能 量,並散發大量能量。而由於電子設備的工作溫度限制,需要使用冷卻設備對數據中心中服 務器產生的大量熱能進行冷卻。
[0004] 當前,學術界和工業界對於數據中心中能量消耗的問題越來越感興趣。不過,當前 學術界的研究主要專注於
[0005] 1、提高伺服器的耗能效率,包括使用虛擬化技術,動態電壓、頻率切換等。
[0006] 2、解決製冷系統中能量效率問題,主要是計算機房間空調系統(Computer Room Air Conditioner, CRAC)製冷效率的提高。
[0007] 3、其它提高方式。如通過動態負載來達到降溫和計算功率的平衡;通過對IT設 備、功率及降溫設施的整合管理等。
[0008] 然而,對於如何分配任務給伺服器,使得伺服器和冷卻系統的總功率消耗降低,這 個問題,卻並沒有涉及。
【發明內容】
[0009] 針對上述現有技術中存在的技術問題,本發明提供一種基於熱負載均衡的數據中 心自適應性耗能管理方法,來動態地分配伺服器任務,使數據中心中伺服器和冷卻系統的 總功率消耗降低。考慮到問題可擴展性、實時性和應用性,對數據中心中的製冷系統和服務 器模型進行了相應的設計和約束,並設計了一種任務分配算法,能夠實時地將任務分配給 各伺服器。
[0010] 為達到上述目的,本發明所採用的技術方案如下:
[0011] 一種基於熱負載均衡的數據中心自適應性耗能管理方法,在每個採樣時間內,採 用以下步驟進行耗能管理:
[0012] 1)使用RLS模型估算伺服器的功耗;
[0013] 2)在約束條件下對費用函數進行優化求解,得出最優的Up(k);
[0014] 3)從%(1〇中選出第一組輸入U(k|k)作為真實的控制量U(k);
[0015] 4)計算需要的活躍伺服器個數mj ;
[0016] 5)平均分配任務到每個機架。
[0017] 所述步驟1)的方法是:
[0018] a)首先建立熱量模型、功率消耗模型以及任務模型;
[0019] b)對數據中心功率控制,對所述功率消耗模型做處理能力、負載、功率輸入、總功 率的限制;
[0020] C)基於RLS的熱量模型評估。
[0021] 所述步驟a)中,熱量模型的建立方法是:
[0022] 根據熱力學定理,機架j出口的空氣溫度與機架j輸入空氣溫度,機架j功率消耗 的關係為:
[0023]
【權利要求】
1. 一種基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵在於,在每個採樣 時間內,採用以下步驟進行耗能管理: 1) 使用RLS模型估算伺服器的功耗; 2) 在約束條件下對費用函數進行優化求解,得出最優的Up(k); 3) 從%(1〇中選出第一組輸入U(k|k)作為真實的控制量U(k); 4) 計算需要的活躍伺服器個數; 5) 平均分配任務到每個機架。
2. 根據權利要求1所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟1)的方法是: a) 首先建立熱量模型、功率消耗模型以及任務模型; b) 對數據中心功率控制,對所述功率消耗模型做處理能力、負載、功率輸入、總功率的 限制; c) 基於RLS的熱量模型評估。
3. 根據權利要求2所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟a)中,熱量模型的建立方法是: 根據熱力學定理,機架j出口的空氣溫度與機架j輸入空氣溫度,機架j功率消耗的關 係為:
根據熱力學定理,機架j輸入空氣溫度,同機架j輸出空氣溫度及CRACh輸出空氣溫度 的關係為:
同理,根據熱力學定理,CRACh出口的空氣溫度,輸入空氣溫度與CRACh功率消耗,機架 j出口的空氣溫度間關係為:
功率消耗模型的建立方法是: 對於功率消耗模型,由於伺服器的功率消耗主要依賴於伺服器的兩個參數,CPU使用率 和頻率,假定在每個伺服器CPU頻率一定的情況下,伺服器的功率消耗則主要同CPU使用率 相關,同時,假定可以採用開-關伺服器以節省伺服器能耗的策略,則機架j上功率消耗還 和機架j上保持開狀態的伺服器個數相關,因此,可以對其功率建模為:
任務模型的建立方法是: 考慮Web伺服器架構產生的數據請求,前段Web伺服器從客戶端接收用戶請求後,將這 些請求分配到不同機架的伺服器上進行處理,其中,總請求數為:
根據排隊論,對任務請求的平均處理延時為:
考慮到實時性,需要對任務的平均處理延遲進行限制,即其最大值在一定範圍內:
4.根據權利要求3所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟b)對功率消耗模型做處理能力、負載、功率輸入、總功率的限制的方法是: 對於一般的連續系統而言,其狀態空間模型為:
Y = WX, 其中
對離散系統而言,其狀態模型為: X(k) = 〇X(k-l)+GU(k-l), Y (k) = WX (k), 其中,
是系統的第k個採樣周期,該離散系統的模型參數為
在該離散系統中,涉及對處理能力、負載、功率輸入、總功率 限制如下; (1)處理能力限制 根據任務模型中對服務延遲的限制,將公式變形為:
將其變換為矩陣形式,為:
其中, ^ 1 - (Imxm 〇mxf),
(2) 負載限制 能夠被伺服器服務的負載量為:
其中,PA是對應於每個請求的平均功率; (3) 功率輸入限制 首先,每個機架的伺服器和CRAC的輸入功率都是非負的,同時CRAC的輸入功 率必須是整數級的,可以對其限制為: U > 〇(M+F) XI, Pj ^ PmaxJ Pj e Z+ Pmax是CRAC功率輸入的最大允許值,將其變為矩陣形式為: ψ3υ< [pmax]FX1, 其中, Ψ3_ (〇FXM !FXF); (4) 總功率限制 機架伺服器和CRAC的總功率需求為: 將其變換為矩陣形式為:
ψ4υ ^ Pd, 其中,Ψ4 = [1,…,1]1X(M+F) ·,Pd是總功率需求的上界。
5.根據權利要求4所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟c)基於RLS的熱量模型評估的方法是:使用計算流體力學CFD分析方法,將 功率消耗建模為多輸入多輸出線性模型:
其中,
基於RLS模型,對系統模型進行重寫,將其形式變為: X (k+1) = A (k) Φ (k) 其中, Φ (k) = [UT(k),XT(k)]T, X(k) = [B, A], 使用RLS模型,主要用於計算系統矩陣A和B,由於使用的RLS模型,依賴於時間變量, 考慮其根據時間的迭代過程為:
其中
表示模型的估計量,E(k+1)表示估測誤差向量,P(k)為協方差矩陣,
為遺 忘因子,
6. 根據權利要求1所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟2)的方法是:使用模型預測控制MPC控制方法進行控制,MPC控制器通過計 算控制輸入U(k)來最小化下列費用函數:
其中,Ργ和Ρ"是狀態和輸入的預測長度範圍,X(k+s | k)是之後第s個採樣間隔的狀態 預測,
和U(k+s|k)都是類似的,Q(s)和R(s)是用來對時間誤差和輸入功率的 補償矩陣,其中I |x| |Q(S) = xTQ(s)x,該費用函數主要為最小化溫度追蹤誤差和功率需求, 即:使功率需求較小的同時,使得不同時間間隔間的溫度變化較小,因此,需要在每一個時 間間隔中,對該費用函數求解最小值,並滿足相應約束條件如下:
Pj e Z+, 其中:
Q = diag [Q (s) ],R=diag [R (s)]。
7. 根據權利要求1所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟4)的方法是:在滿足處理能力約束的情況下,應儘可能地減少保持開狀態 的處理器,因此,設定每次保持開狀態的處理器個數為:
並滿足限制
8.根據權利要求1所述的基於熱負載均衡的數據中心自適應性耗能管理方法,其特徵 在於,所述步驟5)的方法是:假定每個任務的分配,在各個伺服器上是均一的,因此,每個 機架上分到的任務數為:
並滿足約束
【文檔編號】H04L12/24GK104158754SQ201410322951
【公開日】2014年11月19日 申請日期:2014年7月8日 優先權日:2014年7月8日
【發明者】姚建國, 周海航, 管海兵 申請人:上海交通大學