伺服器及自動檢修基板管理控制器的方法與流程
2024-02-13 12:42:15 1

本發明是有關於一種系統及自動修復電子資料的方法,特別是指一種伺服器及自動檢修基板管理控制器的方法。
背景技術:
現有的基板管理控制器(Baseboard Management Controller,BMC)適用於伺服器,並支援智慧平臺管理界面(Intelligent Platform Management Interface,IPMI)的工業標準,用來監控伺服器主機板上的硬設備的狀態,如環境溫度、風扇轉速、供電情況等。然而,當該基板管理控制器發生異常,如系統功能崩潰或硬體問題,現有技術皆需要派遣人力至伺服器旁檢視該基板管理控制器的心跳(heartbeat)燈號,當燈號未點亮時,人員才判斷該基板管理控制器已死機,並進行檢修,不僅增加檢修時間且耗費人力成本,因而成為一個待解決的重要課題。
技術實現要素:
本發明的目的在於提供一種伺服器。
本發明的另一目的是提供一種自動檢修基板管理控制器的方法。
本發明伺服器,包括一基板管理控制器、一控制晶片組,及一基本輸入輸出單元。
該基板管理控制器具有一接收一重置信號來將電源重置的重置埠。
該控制晶片組電連接該基板管理控制器的重置埠。
該基本輸入輸出單元電連接該控制晶片組,並於上電啟動時,發出一詢問指令經由該控制晶片組至該基板管理控制器,並判斷是否接收到來自該基板管理控制器的一回復指令,若否,則該基本輸入輸出單元發出一重置信號經由該控制晶片組至該基板管理控制器的重置埠,以將該基板管理控制器的電源重置。
本發明自動檢修基板管理控制器的方法,包括一步驟(A)、一步驟(B)、一步驟(C),及一步驟(D)。
該步驟(A)是該伺服器上電啟動。
該步驟(B)是該基本輸入輸出單元發出一詢問指令經由該控制晶片組至該基板管理控制器。
該步驟(C)是該基本輸入輸出單元判斷是否接收到來自該基板管理控制器的一回復指令。
該步驟(D)是若步驟(C)的判斷結果為否,則該基本輸入輸出單元發出一重置信號經由該控制晶片組至該基板管理控制器。
本發明之功效在於:伺服器上電啟動時,當該基本輸入輸出單元詢問該基板管理控制器卻未接收到回復,該基本輸入輸出單元即將該基板管理控制器的電源重置,以此達到自動檢修的效果,而能節省人力並且縮短檢修時間。
【附圖說明】
圖1是一系統方塊圖,說明本發明伺服器的實施例;及
圖2是一流程圖,說明本發明自動檢修基板管理控制器的方法的實施例。
【具體實施方式】
參閱圖1,本發明伺服器的一實施例包括一基板管理控制器(Baseboard Management Controller,BMC)1、一控制晶片組2、一基本輸入輸出單元(Basic Input/Output System,BIOS)3,及一內部整合電路總線界面(Inter-Integrated Circuit Bus,I2C Bus)4。
該基板管理控制器1具有一接收一重置信號來將電源重置的重置埠(reset pin),及一輸出一初始化指示信號的就緒埠(ready pin)。其中,在該基板管理控制器於尚未完成初始化前,該初始化指示信號預設處於一未就緒電位,並於該基板管理控制器1初始化就緒而變換至一就緒電位。
該控制晶片組2具有多個通用輸入輸出埠(General-Purpose Input/Output pins,GPIO pins),其中一個通用輸入輸出埠電連接該基板管理控制器1的重置埠,且另一個通用輸入輸出埠電連接該基板管理控制器1的就緒埠以接收該初始化指示信號。在本例中,該控制晶片組2是以平臺控制器中心(Platform Controller Hub,PCH)來實施。
該基本輸入輸出單元3電連接該控制晶片組2,並於一開機準備時間內,判斷該基板管理控制器1是否初始化就緒。在本實施例中,該基本輸入輸出單元3經由該控制晶片組2,與該基板管理控制器1以智慧平臺管理界面指令(IPMI command)溝通。其中,該開機準備時間是指在伺服器上電後到該基本輸入輸出單元3開始執行一開機自我檢測(Power-On Self Test,POST)前的這一段時間,而該開機準備時間的長短設定,主要是依據該基板管理控制器1何時送出初始化指示信號,一般約為六十秒至九十秒。
該內部整合電路總線界面4電連接該基板管理控制器1及該控制晶片組2,以傳輸該基板管理控制器1及該控制晶片組2之間的智慧平臺管理界面指令。
參閱圖2,本發明自動檢修基板管理控制器的方法是在圖1所示的伺服器中實施。以下詳細說明該方法的各個步驟。
首先,在步驟A中,該伺服器上電啟動。
接著,在步驟E中,該基本輸入輸出單元3在該開機準備時間內,經由該控制晶片組2讀取來自該基板管理控制器1的初始化指示信號,以判斷該基板管理控制器1是否初始化就緒。更詳細來說,該基本輸入輸出單元3每間隔一秒鐘讀取一次該初始化指示信號,且根據該初始化指示信號是否自該未就緒電位變換至該就緒電位,來判斷該基板管理控制器1是否初始化就緒。若判斷為是,即直接進到步驟B,若判斷為否,則進入步驟F。
接著,在步驟F中,該基本輸入輸出單元3判斷該開機準備時間是否達到一開機準備時間上限。若尚未大於該基本輸入輸出單元3的開機準備時間上限,則回到步驟E,持續讀取該初始化指示信號,以判斷該基板管理控制器1是否初始化就緒;若已經過開機準備時間上限(例如九十秒),即便該基板管理控制器1仍未初始化就緒,即直接進到步驟B。如此一來,儘管該基板管理控制器1因為系統功能崩潰或硬體發生問題,以致該初始化指示信號未變換至該就緒電位,該基本輸入輸出單元3也會繼續進行開機流程。
接著,在步驟B中,該基本輸入輸出單元3開始執行該開機自我檢測,並於此時發出一詢問指令經由該控制晶片組2至該基板管理控制器1。其中,該詢問指令可以詢問該基板管理控制器1版本信息的指令來實施。
接著,在步驟C中,該基本輸入輸出單元3判斷是否接收到來自該基板管理控制器1的一回復指令,以確認該基板管理控制器1是否為存活。其中,該回復指令即為該基板管理控制器1回傳的版本信息。若步驟C的判斷為是,即進到步驟G;若步驟C的判斷為否,則進到步驟D。
在步驟D中,若該基本輸入輸出單元3在步驟C沒有接收到該基板管理控制器1的該回復指令,則判斷該基板管理控制器1沒有存活,無法正常運作提供服務,該基本輸入輸出單元3發出該重置信號經由該控制晶片組2至該基板管理控制器1的重置埠,以將該基板管理控制器1的電源重置。
接著,在步驟J中,該基板管理控制器接收該重置信號後將自身重新啟動,且重新進入步驟E,由該基本輸入輸出單元3來判斷該基板管理控制器1是否初始化就緒。因此,通過該基本輸入輸出單元3的檢查機制,當該基板管理控制器1無法正常運作時,不需要由人力檢視燈號判斷其運作情形,該基本輸入輸出單元3即直接重啟該基板管理控制器1,可節省人力成本與縮短檢修時間。
在步驟G中,若該基本輸入輸出單元3在步驟C接收到該基板管理控制器1的該回復指令,則該基本輸入輸出單元3等候一預定時間,並進入步驟H。
接著,在步驟H中,該基本輸入輸出單元3判斷所執行的該開機自我檢測是否結束,若該基本輸入輸出單元3判斷仍在該開機自我檢測階段,則返回步驟B,並重複步驟B、步驟C、步驟G,也就是說,該基本輸入輸出單元3會在該開機自我檢測的過程間,每間隔該預定時間,周期性的重複發出該詢問指令,以確認該基板管理控制器1已經初始化就緒並仍保持為存活狀態。若該基本輸入輸出單元3判斷已結束該開機自我檢測階段,則進到步驟I。
接著,在步驟I中,該基本輸入輸出單元3完成該開機自我檢測,即移交系統控制權予作業系統。
綜上說明可知,本發明在伺服器上電啟動時,該基本輸入輸出單元3在該開機準備時間讀取該初始化指示信號以判斷該基板管理控制器1是否初始化就緒,並於該開機自我檢測的過程間,周期性的重複發出該詢問指令,以確認該基板管理控制器1已經初始化就緒並仍保持為存活狀態。如果未接收到該基板管理控制器1的回覆指令,該基本輸入輸出單元3即發出該重置信號至該基板管理控制器1的重置埠,將該基板管理控制器1的電源重置,以此達到自動檢修的效果,從而能節省人力並且縮短檢修時間,所以確實能達成本發明的目的。
以上所述僅為本發明的較佳實施例而已,不能以此限定本發明的實施範圍,大凡依本發明申請專利範圍及專利說明書內容所作的簡單、等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。