一種應用於刀片伺服器的智能散熱控制方法
2023-10-08 07:38:44 5
專利名稱:一種應用於刀片伺服器的智能散熱控制方法
技術領域:
本發明涉及一種伺服器散熱技術領域,具體地說是一種應用於刀片伺服器的智能散熱控制方法。
背景技術:
隨著雲計算技術的發展,人們對高密度計算的伺服器的需求越來越強烈,而刀片伺服器,作為一種小體積,高密度伺服器架構,日益受到大型機房建造者們的歡迎,成為伺服器應用的主流機種,但是,高密度帶來系統散熱能力的需求日益增加,這樣對風扇轉速和風壓的要求也會隨之不斷增加,這種現象會帶來兩個負面 的問題。第一,風扇轉速和風壓的增加,必將會帶來風扇功耗的增加,而作為高密度計算集群應用的刀片伺服器對電功率的要求本身就比較大,風扇功耗的增大將會使刀片系統不得不犧牲一部分應用或性能來保證刀片系統整體的電能供應。第二,由於風扇高轉速和高風壓所帶來設計技術難度的增加,使得風扇的故障率也趨於升高,而且一旦系統的一枚風扇發生故障,所有的系統刀片都要進入保護狀態,可能將造成整個伺服器直接停機或低效能運行。
發明內容
本發明的目的是提供一種應用於刀片伺服器的智能散熱控制方法。本發明的目的是按以下方式實現的,系統包括刀片計算節點,風扇系統和系統管理中樞SMC,刀片節點與系統管理中樞SMC之間通過IPMI協議相連,系統管理中樞SMC通過IPMI協議從刀片節點讀取其當前計算負載和溫度,或發送指令至刀片節點來調節其CPU和內存的頻率控制刀片功耗;同時,每個風扇也獨立的與系統管理中樞SMC通過12C協議相連,將轉速信息反饋給系統管理中樞SMC,或接收來自系統管理中樞SMC的指令來調節風扇轉速;另外,各刀片與各風扇均是以獨立地址與系統管理中樞SMC通訊,以保證在控制系統中的獨立性;具體控制步驟如下
1)每一枚風扇對應給兩片刀片散熱,當各個刀片負載與溫度大致相同時,風扇的轉速比較接近,而當其中某一刀片節點的負載增大時,系統管理中樞SMC就會得到其負載和溫度變化的信息,之後系統管理中樞SMC會發出轉速增加指令到與刀片對應的風扇,使其提高風量,而其他的刀片與風扇則不受影響,當某一刀片負載較小時,系統管理中樞SMC則會採取相反的動作,使其風量減小,實現各個刀片對風量的「各取所需」,最大的節約了風扇的總功耗;
2)當某一個風扇發生故障時,系統管理中樞SMC將會讀取到該風扇的轉速異常,當連續幾次讀取均為異常後,系統管理中樞SMC將向該風扇所對應的刀片發出降低其負載的指令,刀片節點負載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片上的信息數據不會損失,等待系統管理員對數據進行備份,以及對風扇的修復,在這種情況下,其他的刀片節點並不受到影響,實現了風扇的獨立故障處理。
本發明的有益效果是包含兩個方面的內容
O同一刀片伺服器系統的每一個風扇都可以根據自己負責散熱的刀片計算節點的計算負載和運行溫度來調節自己的轉速,實現同一系統內的各個風扇的分區散熱控制;
2)當某一個風扇發生故障導致轉速不正常時,只有與其對應散熱的刀片計算節點會通過降頻率,降電壓的方法降低刀片的負載,其他的刀片並不會受到影響,從而實現刀片過熱保護的獨立控制。
圖I是伺服器風扇正常散熱工況示意 圖2是根據刀片負載狀況調整散熱系統的工況示意圖;
圖3是風扇出現故障時的系統散熱工況示意圖。
具體實施例方式本發明是一種應用於刀片伺服器的智能散熱控制管理方法,意在克服刀片伺服器在風扇和溫度管理上的各個難點,設計出一種適用於刀片伺服器的智能散熱控制管理系統,可以實現系統刀片散熱的分區風扇控制和風扇獨立故障處理。參照說明書附圖對本發明的方法作以下詳細地說明。(I)整個散熱控制方案主要由三部分組成,分別是刀片計算節點,風扇系統和系統管理中樞(SMC),如圖I,刀片節點與SMC之間通過IPMI協議相連,SMC可以通過IPMI協議從刀片節點讀取其當前計算負載和溫度,也可以發送指令至刀片節點來調節其CPU和內存的頻率,控制刀片功耗。同時,每個風扇也獨立的與SMC通過I2C協議相連,可以反饋轉速信息給SMC,也可以接收來自SMC的指令來調節風扇轉速。另外,各刀片與各風扇均是以獨立地址與SMC通訊,這樣可以保證它們在控制系統中的獨立性;
(2)現以單機箱20刀10風扇的刀片伺服器為例,每一枚風扇對應給兩片刀片散熱,如圖I所示,當各個刀片負載與溫度大致相同時,風扇的轉速比較接近,而當其中某一刀片節點(比如刀片1,如圖2)的負載增大時,SMC就會得到其負載和溫度變化的信息,之後SMC會發出轉速增加指令到與刀片I對應的風扇0,使其提高風量,而其他的刀片與風扇則不受影響。當某一刀片負載較小時,SMC則會採取相反的動作,使其風量減小。總之,實現了各個刀片對風量的「各取所需」,最大的節約了風扇的總功耗;
(3)當某一個風扇(比如風扇I,如圖3)發生故障時,SMC將會讀取到風扇I的轉速異常,當連續幾次讀取均為異常後,SMC將向風扇I所對應的刀片2和3發出降低其負載的指令,刀片節點負載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片
2、3上的信息數據不會損失,等待系統管理員對數據進行備份,以及對風扇的修復,在這種情況下,其他的刀片節點並不受到影響,實現了風扇的獨立故障處理。除說明書所述的技術特徵外,均為本專業技術人員的已知技術。
權利要求
1.一種應用於刀片伺服器的智能散熱控制方法,其特徵在於系統包括刀片計算節點,風扇系統和系統管理中樞SMC,刀片節點與系統管理中樞SMC之間通過IPMI協議相連,系統管理中樞SMC通過IPMI協議從刀片節點讀取其當前計算負載和溫度,或發送指令至刀片節點來調節其CPU和內存的頻率控制刀片功耗;同吋,每個風扇也獨立的與系統管理中樞SMC通過I2C協議相連,將轉速信息反饋給系統管理中樞SMC,或接收來自系統管理中樞SMC的指令來調節風扇轉速;另外,各刀片與各風扇均是以獨立地址與系統管理中樞SMC通訊,以保證在控制系統中的獨立性;具體控制步驟如下 1)每一枚風扇對應給兩片刀片散熱,當各個刀片負載與溫度大致相同時,風扇的轉速比較接近,而當其中某一刀片節點的負載增大時,系統管理中樞SMC就會得到其負載和溫度變化的信息,之後系統管理中樞SMC會發出轉速増加指令到與刀片對應的風扇,使其提高風量,而其他的刀片與風扇則不受影響,當某一刀片負載較小吋,系統管理中樞SMC則會採取相反的動作,使其風量減小,實現各個刀片對風量的「各取所需」,最大的節約了風扇的總功耗; 2)當某ー個風扇發生故障時,系統管理中樞SMC將會讀取到該風扇的轉速異常,當連續幾次讀取均為異常後,系統管理中樞SMC將向該風扇所對應的刀片發出降低其負載的指令,刀片節點負載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片上的信息數據不會損失,等待系統管理員對數據進行備份,以及對風扇的修復,在這種情況下,其他的刀片節點並不受到影響,實現了風扇的獨立故障處理。
全文摘要
本發明提供一種應用於刀片伺服器的智能散熱控制方法,系統包括刀片計算節點,風扇系統和系統管理中樞SMC,刀片節點與系統管理中樞SMC之間通過IPMI協議相連,系統管理中樞SMC通過IPMI協議從刀片節點讀取其當前計算負載和溫度,或發送指令至刀片節點來調節其CPU和內存的頻率控制刀片功耗;同時,每個風扇也獨立的與系統管理中樞SMC通過I2C協議相連,將轉速信息反饋給系統管理中樞SMC,或接收來自系統管理中樞SMC的指令來調節風扇轉速;另外,各刀片與各風扇均是以獨立地址與系統管理中樞SMC通訊,以保證在控制系統中的獨立性。
文檔編號G06F1/20GK102662444SQ20121004045
公開日2012年9月12日 申請日期2012年2月22日 優先權日2012年2月22日
發明者王歡 申請人:浪潮電子信息產業股份有限公司