一種機架伺服器系統及其監控方法
2024-02-16 22:42:15
專利名稱:一種機架伺服器系統及其監控方法
技術領域:
本發明是有關於一種監控機制,且特別是有關於一種機架伺服器系統的監控系統與方法。
背景技術:
由於電腦工業日益進步,且企業對於工業電腦系統的依賴也逐日提升,工業電腦通常特指非個人電腦或非消費性的電子系統,舉例來說,工業電腦包含了使用在工廠自動化的核心控制設備、網頁伺服器、企業的資料備份伺服器等等。隨著電子技術與工業電腦相關應用的進展,業界對於伺服器系統的要求自然相對提高。而為應對企業的成長,許多企業通常將為數眾多的伺服器單元整合於電腦機箱當中, 並可利用多組電腦機箱搭配組成工業電腦機組,以應付大量產生的資料量或網絡流量等需求,同時也能應對日後伺服器系統的擴充與升級等需求。一般來說,一套工業電腦機組可能包含多個系統機架,而每一個系統機架中進一步包含多個電腦伺服器(如刀片式電腦)。此外,一般工業電腦需要長期處於運作的狀態下,一旦有任何硬體發生故障等問題時,企業往往要求伺服器系統在不停機的狀態下進行維修或更換該硬體。因此,主機板的熱插拔(Hot Swap)需求、電力功率供應分配以及散熱風扇相互支持等系統功能也因應而生。此外,為了提高工業電腦設備中電力供應的穩定性,也發展出了許多系統電力狀態監控、電源模組糾錯、電壓電流控管等保護機制。實際應用中,使用者或電腦系統的管理員需要監控各個機架上每一伺服器的運作狀態。在現有的電腦機組上,使用者可通過瀏覽程序或其他連線軟體的控制介面,藉由特定的網絡通訊協議(如SSH加密網絡協議)連線到各個機架上的基板管理控制器,來查看特定機架上特定伺服器的狀態信息。然而,一套電腦機組可能具有數個甚至數十個機架,而每一機架又可包含多個伺服器,若每次需要監控的時候都需要逐一登陸每個機架上的監控介面,並等待密碼驗證,使用上殊為不便。此外,現有的監控介面並無法刷新目前的狀態信息,也就是說,當使用者需重新連線到各個機架上的控制單元(如機架基板管理控制器)才能得到最新的狀態信息,更造成監控管理上的困擾。
發明內容
為了解決上述問題,本發明提出一種機架伺服器系統及監控方法,通過管理單元與各個機架上的控制單元通訊連接,管理單元可由相對應的控制單元讀取使用者指定的機架的狀態信息,並可將其內容整合顯示在一顯示器上,方便使用者檢閱。此外,在管理單元取得狀態信息時,同時建立一自動程序,每隔一段預定周期,自動程序便可觸發將狀態信息主動回傳至管理單元以進行更新。如此一來,便可省下反覆的登陸認證手續與等待時間,讓使用者或系統管理者可更方便地掌握機架伺服器系統的整體狀態。
因此,本發明內容目的之一是提供一種機架伺服器系統,其包含多個機架以及一管理單元。其中,機架各自包含多個伺服器以及一控制單元。該控制單元與伺服器連接並獲取各伺服器的一狀態信息,該控制單元隨時間更新狀態信息。管理單元用以與各機架上的該控制單元通訊連接,該管理單元由控制單元取得伺服器的狀態信息以生成一狀態信息表,且同時該管理單元建立一自動程序。其中,每隔一預定周期,該自動程序觸發各機架上的該控制單元並將該狀態信息更新至該管理單元。根據本發明內容的一實施例,其中伺服器各自包含一伺服器基板管理控制器,以接收各伺服器的一溫度值。根據本發明內容的一實施例,其中各機架的控制單元為一機架基板管理控制器。根據本發明內容的一實施例,其中各機架進一步包括多個風扇,各機架上的該控制單元接收風扇的多個轉速值,並控制風扇的轉速。根據本發明內容的一實施例,其中該狀態信息表包括機架的多個網絡地址、伺服器的多個溫度值以及風扇的多個轉速值。根據本發明內容的一實施例,其中該管理單元根據使用者操作由機架中選取一部分的機架,該管理單元針對被選中的機架由相對應的該控制單元取得該狀態信息並建立該自動程序。根據本發明內容的一實施例,其中該自動程序建立並執行在該些機架的一運算處理器或該控制單元上。根據本發明內容的一實施例,其中該管理單元將該狀態信息表的內容顯示在一顯不器上。本發明內容的另一目的是提供一種監控方法,用於一機架伺服器系統,該機架伺服器系統包含多個機架以及一管理單元,機架分別具有多個伺服器以及一控制單元,其中該監控方法包含下列步驟(1)在機架中,分別通過該控制單元獲取各該伺服器的一狀態信息,且該控制單元隨時間更新該狀態信息;(2)由該管理單元通訊連接至控制單元以取得狀態信息;以及(3)建立一自動程序,藉以觸發各該機架上的該控制單元每隔一預定周期將狀態信息傳送至該管理單元。根據本發明內容的一實施例,監控方法更包含下列步驟根據使用者操作由系統單元中選取一部分的系統單元,並且於上述步驟( 及步驟C3)當中,該管理單元針對被選中的機架由相對應的控制單元取得該狀態信息以及建立該自動程序。如此便可省下反覆的登陸認證手續與等待時間,讓使用者或系統管理者可更方便地掌握機架伺服器系統的整體狀態。
為讓本發明的上述和其它目的、特徵、優點與實施例能更明顯易懂,所附附圖的詳細說明如下圖1繪示根據本發明的一實施例中一種機架伺服器系統的示意圖。圖2繪示根據本發明的一實施例中一種監控方法的方法流程圖。
圖3繪示圖2中的監控方法其操作實例的流程示意圖。主要元件符號說明100 機架伺服器系統120 機架122 伺服器IM 控制單元126 風扇140 管理單元160 顯示器SlOO 步驟S102 步驟S104 步驟S200 步驟S202 步驟S204 步驟S2O6 步驟S208 步驟S210 步驟
具體實施例方式請參閱圖1,其繪示根據本發明的一實施例中一種機架伺服器系統100的示意圖。 如圖ι所示,機架伺服器系統100中包含多個機架120、管理單元140以及顯示器160。在本實施例中,管理單元140可用來對應管理多組機架120,圖1中僅繪示三組機架120作為舉例,但本發明並不以三組為限,舉例來說,在部份實施例中,作為中央資料伺服器(data center)的機架伺服器系統100可包含共數十組以上機架120。其中,每一組機架120中包含多個伺服器(server) 122以及一控制單元124,圖1 中以每一機架中包含兩組伺服器122為例,但本發明並不以此為限。在本實施例中,每一伺服器122可各自包含伺服器基板管理控制器(baseboard management controller, BMC), 伺服器基板管理控制器可用以接收各伺服器122運作時的溫度值。在本實施例中,控制單元IM是機架120上的機架基板管理控制器(BMC),控制單元IM可與各別伺服器122上的伺服器基板管理控制器連接並獲取各伺服器122的一狀態信息,控制單元124隨時間更新狀態信息。其中各機架120可進一步包括多個風扇126,各機架120上的控制單元1 (機架 BMC)接收風扇126的轉速值,並控制風扇1 的轉速,圖1中以各機架120包含兩組風扇 126為例,但本發明並不以此為限。控制單元124則可獲得各伺服器122的狀態信息,並可獲知及控制機架120上的風扇轉速,但本發明並不以此為限。實際應用中,控制單元1 可監控的項目可進一步涵蓋溫度、溼度、電源電壓、風扇速度、通信參數和作業系統函數等等各種機架上的運行參數。此夕卜,在本實施例中,控制單元IM可隨時間更新狀態信息,以維持狀態信息的即時性。管理單元140用來與控制單元IM通訊連接,因此,管理單元140由控制單元124 取得伺服器122的狀態信息以及機架120上的各種信息,管理單元140進而據此生成狀態信息表,其中狀態信息表的內容可包括機架120的網絡地址(如IP address)、伺服器122 的溫度值以及風扇126的轉速值。在本實施例中,管理單元140通過網絡協議與控制單元 IM通訊連接。為了增進傳輸上的安全性,並進行使用者的身分認證,在實際應用中此處的網絡協議可採用安全殼層(Secure Shell, SSH)加密網絡協議。當使用者通過SSH加密網絡協議登陸控制單元124,需要輸入使用者名稱及密碼,需要一定的認證程序與認證時間。須注意的是,管理單元140取得狀態信息並同時建立一自動程序。這一自動程序是用以觸發機架120上的控制單元IM每隔一預定周期便將狀態信息傳送至管理單元140。 在本實施例中,自動程序可以是建立在控制單元1 上的軟體腳本(software script), 但本發明並不以此為限。在另一實施例中,機架120可另包含一運算處理器(未繪示),自動程序也可以是建立並執行於運算處理器上的軟體腳本。如此一來,每隔一段預定周期,自動程序便可觸發機架120將狀態信息主動回傳至管理單元140以進行更新。這樣便可省下反覆的登陸控制單元124的認證手續與等待時間,管理單元140可將產生的狀態信息表的內容顯示於顯示器160上,讓使用者或系統管理者可更方便地掌握機架伺服器系統100的整體狀態。此外需補充的是,為了使用上的便利或處理效能的考慮,管理單元140並不限於同時讀取所有機架120的狀態信息,在實際應用中,機架伺服器系統100可提供使用者一個操作介面(如鍵盤、滑鼠等輸入裝置、切換按鈕、觸控介面等等),管理單元140可根據使用者操作由機架120中選取一部分的機架,例如選取其中第一組與第二組機架。管理單元140 針對被選中的機架120,由相對應的控制單元IM取得狀態信息並建立自動程序。請參閱圖2,其繪示根據本發明的一實施例中一種監控方法的方法流程圖。在本實施例中,監控方法可用於一機架伺服器系統,該機架伺服器系統包含多個機架以及一管理單元,機架分別具有多個伺服器以及一控制單元。關於此處機架伺服器系統的內部硬體結構可與先前實施例中的機架伺服器系統100大致相似,請一併參考本發明前述實施例以及圖1中的機架伺服器系統100。如圖2所示,本發明的監控方法首先執行步驟S100,在機架中分別通過該控制單元獲取各伺服器的一狀態信息,其中,控制單元隨時間更新狀態信息。接著,執行步驟S102,管理單元通訊連接至控制單元,並且管理單元從控制單元取得狀態信息。最後,執行步驟S104,建立自動程序,藉以觸發機架每隔一預定周期將狀態信息傳送至管理單元,管理單元可以此進一步建立狀態信息表。如此一來,自動程序便可周期性地將狀態信息主動回傳至管理單元,以便管理單元刷新狀態信息表的內容。如此一來,便可省下反覆的形成通訊連接的手續與時間,且使用者或系統管理者可更方便地監視機架伺服器系統的整體狀態。此外,本發明的監控方法中並不限於同時讀取所有機架的狀態信息表。在另一實施例中,本發明的監控方法可更進一步執行一步驟,以根據使用者操作由機架中選取一部分的機架,而相對應地在上述步驟S102及步驟S104當中,管理單元針對被選中的機架由相對應的控制單元取得狀態信息以及建立自動程序,藉此可提高資料處理效率。此外,請一併參閱圖3,其繪示圖2中的監控方法其操作實例的流程示意圖。在實際應用中,機架中的控制單元可預設為自動性地產生狀態信息(即圖2中的步驟S100)。如圖3所示,在系統管理員或使用者操作實例中,可先執行步驟S200,在機架上開啟瀏覽器上相對應的連接頁面。接著,執行步驟S202,允許使用者在連接頁面上點選目前想顯示出來個別機架或機架群組。接著,管理單元便會執行步驟S204,判斷管理單元上是否已存在被選取的機架的狀態信息。此時,若不存在上述狀態信息表,表示管理單元尚不曾與被選取的機架連線過,此時便可執行步驟S206-S208(可參見前述段落中的步驟S102-S104),藉以取得狀態信息並建立自動程序。接著便可執行步驟S210,根據取得的狀態信息建立狀態信息表,並將其內容顯示在瀏覽器相對應的連接頁面上,且自動程序會將狀態信息表的內容進行自動更新。若執行步驟S204中,判斷已存在上述狀態信息,表示之前管理單元已與被選取的機架完成連線,且已取得狀態信息並建立自動程序,此時,可直接執行步驟S210,將其內容顯示在瀏覽器相對應的連接頁面上。由此可知,管理單元只有在第一次連接至特定機架時,需要通過網絡協議(如SSH 協議)從機架取得狀態信息表並建立自動程序(即圖2中的步驟S102-S104或圖3中的步驟S206-S208),之後,機架便會主動地刷清管理單元上狀態信息表的內容。如此一來,便可省下反覆的登陸認證手續與等待時間,讓使用者或系統管理者可更方便地掌握機架伺服器系統的整體狀態。雖然本發明已以實施方式揭示如上,然其並非用以限定本發明,任何本領域的普通技術人員,在不脫離本發明的精神和範圍內,當可作各種更動與潤飾,因此本發明的保護範圍當視後附的申請專利範圍所界定者為準。
權利要求
1.一種機架伺服器系統,其特徵在於,所述系統包括多個機架,各所述機架包含多個伺服器;以及一控制單元,所述控制單元與所述伺服器連接並獲取各所述伺服器的一狀態信息,所述控制單元隨時間更新所述狀態信息;以及一管理單元,用以與各所述機架上的所述控制單元通訊連接,所述管理單元由所述控制單元取得所述伺服器的狀態信息以生成一狀態信息表,且建立一自動程序;其中,每隔一預定周期,所述自動程序觸發各所述機架上的所述控制單元並將所述狀態信息更新至所述管理單元。
2.根據權利要求1所述的機架伺服器系統,其特徵在於,所述伺服器各自包含一伺服器基板管理控制器,以接收各所述伺服器的一溫度值。
3.根據權利要求1所述的機架伺服器系統,其特徵在於,各所述機架的所述控制單元是一機架基板管理控制器。
4.根據權利要求1所述的機架伺服器系統,其特徵在於,各所述機架進一步包括多個風扇,各所述機架上的所述控制單元接收所述風扇的多個轉速值,並控制所述風扇的轉速。
5.根據權利要求1所述的機架伺服器系統,其特徵在於,所述狀態信息表包括所述機架的多個網絡地址、所述伺服器的多個溫度值以及所述風扇的多個轉速值。
6.根據權利要求1所述的機架伺服器系統,其特徵在於,所述管理單元根據使用者操作由所述機架中選取一部分的機架,所述管理單元系針對被選中的機架由相對應的所述控制單元取得所述狀態信息並建立所述自動程序。
7.根據權利要求1所述的機架伺服器系統,其特徵在於,所述自動程序是建立並執行在所述機架的一運算處理器或所述控制單元上。
8.根據權利要求1所述的機架伺服器系統,其特徵在於,所述管理單元將所述狀態信息表的內容顯示在一顯示器上。
9.一種監控方法,用於一機架伺服器系統,所述機架伺服器系統包含多個機架以及一管理單元,所述機架分別具有多個伺服器以及一控制單元,其特徵在於,所述監控方法包含下列步驟在所述機架中,分別通過所述控制單元獲取各所述伺服器的一狀態信息,且所述控制單元隨時間更新所述狀態信息;由所述管理單元通訊連接至所述控制單元以取得所述狀態信息;以及建立一自動程序,以觸發各所述機架上的所述控制單元每隔一預定周期將所述狀態信息傳送至所述管理單元。
10.根據權利要求9所述的監控方法,其特徵在於,更包含下列步驟根據使用者操作由所述機架中選取一部分的機架,而所述管理單元針對被選中的機架由相對應的所述控制單元取得所述狀態信息以及建立所述自動程序。
全文摘要
本發明提供了一種機架伺服器系統及其監控方法,其中機架伺服器系統包含多個機架以及一管理單元。其中,機架各自包含多個伺服器以及一控制單元。該控制單元與伺服器連接並獲取各伺服器的一狀態信息,該控制單元隨時間更新狀態信息。管理單元用以與各機架上的控制單元通訊連接,該管理單元由控制單元取得伺服器的狀態信息以生成一狀態信息表,且同時該管理單元建立一自動程序。其中,每隔一預定周期,該自動程序觸發各該機架上的控制單元並將該狀態信息更新至該管理單元。如此便可省下反覆的登陸認證手續與等待時間,讓使用者或系統管理者可更方便地掌握機架伺服器系統的整體狀態。
文檔編號G06F11/32GK102479142SQ20101057518
公開日2012年5月30日 申請日期2010年11月30日 優先權日2010年11月30日
發明者王曉華, 王浩皓 申請人:英業達股份有限公司