一種伺服器內存故障報警方法
2023-07-22 16:15:46 1
專利名稱:一種伺服器內存故障報警方法
一種伺服器內存故障報警方法
背景技術:
當前伺服器系統中,現有技術只通過內存部件觸發硬體故障電路信號,通過板載的LED進行故障指示,此類設計存在以下不足
1、故障信息無法記錄,一旦系統斷電,本次開機發現的故障信息將會被清除;
2、系統能識別的故障種類有限僅支持內存部件自身可檢測的簡單錯誤信息,例如內存溫度過高、Eiror IO記錄數量過高。但對於例如內存晶片產生故障、內存安裝錯誤這類內存部件自身無法檢測或報告的錯誤信息,伺服器系統無法產生報警信息;
3、無法根據故障嚴重程度分級別進行報警。
發明內容
通過軟體程序在伺服器系統啟動階段識別內存錯誤信息,將信息傳遞給內嵌主板上的管理晶片進行分類判斷並按級別報警,系統包括故障信息識別單元(I)、錯誤信息資料庫(2)、報警單元(3),其中
故障信息識別單元(I)負責通過獲取系統中內存部件發出的錯誤信息作為判斷內存故障的依據;
錯誤信息資料庫(2)負責收集傳遞內存錯誤信息;
報警單元(3)負責根據不同的錯誤信息判斷選擇不同的故障報警方式;
報警流程如下
系統上電,檢測錯誤信息庫中是否存在歷史錯誤,並檢測故障是否仍存在,其中
1)故障存在,把錯誤信息分類為不同的故障,根據不同的故障按照故障級別以不同的方式進行報警;
2)如果故障不存在,檢測本次開機是否內存發錯誤信息,a)內存發錯誤信息,錯誤信息被記錄到錯誤信息資料庫,把錯誤信息分類為不同的故障,根據不同的故障進行報警;b) 不存在內存發錯誤信息,清除錯誤信息資料庫中的歷史數據。本發明的優異效果是報警單元以軟體進程形式包含在BMC中的監控程序中,可根據錯誤信息資料庫記錄的錯誤數據進行故障報警分類,通過Debug數碼燈、LED燈或者蜂鳴器,根據不同級別的錯誤嚴重程度進行分類報警。在伺服器系統中實施此類內存故障報警方法,可很大程度上可以提高系統的可靠性功能,方便維護,提升產品的整體形象。
圖I是本發明的報警流程圖。
具體實施例方式參照附圖對本發明的報警方法做以下詳細的說明。本發明的方法是將故障信息識別單元以軟體進程形式包含在BIOS中,在系統啟動時查詢錯誤信息資料庫的歷史錯誤信息及本次開機時是否存在內存錯誤信息。通過故障信息識別單元的軟體檢測,不僅可以識別出(1)內存部件自身發出硬體故障電路信號,還可以檢測出(2)內存晶片產生故障、內存安裝錯誤此類內存部件自身無法觸發的錯誤信息;故障信息識別單元(I)可以通過監控通道獲得錯誤信息資料庫(2)中或者當前啟動過程中是否存在內存錯誤信息。錯誤信息資料庫記錄在內嵌主板上的管理晶片(BMC)內的Flash中,當系統遇到斷電時,錯誤信息仍可保存在Flash中不會丟失。以供系統在下次開機的時候檢測上次發現的內存故障。
權利要求
1.一種伺服器內存故障報警方法,其特徵在於,通過軟體程序在伺服器系統啟動階段識別內存錯誤信息,將信息傳遞給內嵌主板上的管理晶片進行分類判斷並按級別報警,系統包括故障信息識別單元、錯誤信息資料庫、報警單元,其中故障信息識別單元負責通過獲取系統中內存部件發出的錯誤信息作為判斷內存故障的依據;錯誤信息資料庫負責收集傳遞內存錯誤信息;報警單元負責根據不同的錯誤信息判斷選擇不同的故障報警方式;報警步驟如下系統上電,檢測錯誤信息庫中是否存在歷史錯誤,並檢測故障是否仍存在,其中1)故障存在,把錯誤信息分類為不同的故障,根據不同的故障按照故障級別以不同的方式進行報警;2)故障不存在,檢測本次開機是否內存發錯誤信息,包括a)內存發錯誤信息,錯誤信息被記錄到錯誤信息資料庫,把錯誤信息分類為不同的故障,根據不同的故障進行報警;b) 不存在內存發錯誤信息,清除錯誤信息資料庫中的歷史數據。
全文摘要
本發明提供一種伺服器內存故障報警方法,通過軟體程序在伺服器系統啟動階段識別內存錯誤信息,將信息傳遞給內嵌主板上的管理晶片進行分類判斷並按級別報警,系統包括故障信息識別單元、錯誤信息資料庫、報警單元,其中故障信息識別單元負責通過獲取系統中內存部件發出的錯誤信息作為判斷內存故障的依據;錯誤信息資料庫負責收集傳遞內存錯誤信息;報警單元負責根據不同的錯誤信息判斷選擇不同的故障報警方式。在伺服器系統中實施本發明的內存故障報警方法,可以很大程度上可以提高系統的可靠性功能,方便維護,提升產品的整體形象。
文檔編號G06F11/34GK102609350SQ201210033268
公開日2012年7月25日 申請日期2012年2月15日 優先權日2012年2月15日
發明者平原 申請人:浪潮電子信息產業股份有限公司