一種雙餘度計算機故障處理的切換方法
2023-07-19 04:40:31 1
專利名稱:一種雙餘度計算機故障處理的切換方法
技術領域:
本發明涉及一種計算機的故障處理方法,尤其涉及一種雙餘度計算機的故障處理切換方法。
背景技術:
為了提高系統的可靠性,許多計算機系統對整個設備或者部分關鍵功能採用雙餘度熱備份的工作方式,當主設備失效或者出現故障後,備份設備能夠判斷到主設備出現故障並自動進行切換,以保證系統繼續正常工作,現今嵌入式計算機對可靠性功耗和體積要求都比較苛刻,此方法必須對設備進行備份,而且在系統出現故障後才會通過備份的設備找到主設備的故障,進行切換,需要的額外資源很大,功耗大,並且運行過程、操作過程相當複雜。發明內容
為了解決背景技術中所存在的技術問題,本發明提出了一種雙餘度計算機故障處理的切換方法,採用離散量信號和FPGA實現故障邏輯,實時完成主從設備的故障判斷、故障信息傳遞及主從功能切換。
本發明的技術解決方案是一種雙餘度計算機故障處理的切換方法,其特殊之處在於所述方法包括以下步驟
1)對系統上電,主設備控制禁止,從設備控制禁止;
2)從設備對系統狀態進行實時監控;
3)從設備判斷主設備是否工作正常;若是,則主設備控制輸出,從設備進行備份監控;若否,則進行步驟4);
4)主設備將故障信息通知從設備;
5)主設備控制禁止,從設備實現切換控制輸出,並同時對主設備監控。
上述步驟幻之後還包括步驟6)若系統運行過程中從設備出現問題,則進行步驟 6)判斷是否進行強制切換,若是,則切換為主設備控制輸出。
上述步驟3)從設備判斷主設備是否工作正常的具體步驟是
3. 1)從設備檢測主設備,首先判斷主設備是否電源失效,若是,則主設備的故障寄存器由『1』置為『0』,若否,則進行步驟3. 2);
3.2)判斷主設備是否有看門狗報警,若是,則主設備的故障寄存器由『1』置為 『0』,若否,則進行步驟3. 3);
3. 3)判斷主設備是否軟體BIT錯誤,若是,則主設備的故障寄存器由『1』置為『0』, 若否,則返回步驟3)重新進行。
上述步驟4)中通知的具體步驟是
4. 1)主設備通過硬體將C_G0/N0g0離散量故障信號由高電平變為低電平;
4. 2)該C_G0/N0g0離散量經過光藕隔離後從低電平變為高電平;
4. 3)步驟2中的高電平故障信號送入從設備的B_g0n0g0_in輸入,通知從設備主設備故障。
上述步驟幻主設備控制禁止,從設備切換的具體步驟是
5. 1)從設備通過中斷通知從設備的應用程式主設備故障,需要切換到從設備;
5. 2)從設備硬體配置內部故障切換控制寄存器的狀態置為『0』,配置為切換狀態;
5.3)切換控制寄存器輸出信號為低電平,表示由從設備進行系統控制;
5. 4)輸出的B_valid信號經過光藕隔離後,送入主設備&C_Valid_in輸入控制主設備切換,主設備通過內部硬體將輸出控制禁止;
5. 5)從設備內部的切換控制寄存器控制切換邏輯將從設備的輸出控制使能。
本發明的方法正常情況下主設備進行系統控制,從設備進行監聽備份;主設備故障時將系統任務切換至從設備運行,由從設備進行系統控制;在系統進入從設備備份控制狀態後,根據實際的需要,可通過強制切換功能將系統任務強行從從設備切換至主設備運行。可以使主從設備之間實現故障判斷、故障信息傳遞及主從功能切換,該方法主從設備完全電氣隔離採用離散量信號和FPGA實現故障邏輯,系統工作機理清楚、控制實現簡單、運行穩定可靠。
圖1是本發明的方法流程圖2是本發明的故障處理及切換具體實施例示意圖3是本發明的方法中從設備故障判斷流程圖4是本發明的方法中從主備故障通知的原理圖5是本發明中從設備切換的流程示意圖;具體實施方式
參見圖1,圖2,本發明的雙餘度計算機故障處理的切換方法,包括以下步驟
1)對系統上電,主設備控制禁止,從設備控制禁止;
2)從設備對系統狀態進行實時監控;
3)從設備判斷主設備是否工作正常;若是,則主設備控制輸出,從設備進行備份監控;若否,則進行步驟4);
參見圖3,從設備判斷主設備是否工作正常的具體步驟是
3. 1)從設備檢測主設備,首先判斷主設備是否電源失效,若是,則主設備的故障寄存器由『1』置為『0』,若否,則進行步驟3. 2);
3.2)判斷主設備是否有看門狗報警,若是,則主設備的故障寄存器由『1』置為 『0』,若否,則進行步驟3. 3);
3. 3)判斷主設備是否軟體BIT錯誤,若是,則主設備的故障寄存器由『1』置為『0』, 若否,則返回步驟3)重新進行。
參見圖4,4)主設備通知從設備,通知的具體步驟是
4. 1)主設備通過硬體將C_G0/N0g0離散量故障信號由高電平變為低電平;
4. 2)該C_G0/N0g0離散量經過光藕隔離後從低電平變為高電平;
4. 3)步驟2)中的高電平故障信號送入從設備的B_g0n0g0_in輸入,通知從設備主設備故障。
參見圖5,主設備控制禁止,從設備實現切換控制輸出,並同時對主設備監控,
具體實現方式是
5. 1)從設備通過中斷通知從設備的應用程式主設備故障,需要切換到從設備;
5. 2)從設備硬體配置內部故障切換控制寄存器的狀態置為『0』,配置為切換狀態;
5.3)切換控制寄存器輸出信號為低電平,表示由從設備進行系統控制;
5. 4)輸出的B_valid信號經過光藕隔離後,送入主設備&C_Valid_in輸入控制主設備切換,主設備通過內部硬體將輸出控制禁止;
5. 5)從設備內部的切換控制寄存器控制切換邏輯將從設備的輸出控制使能。
6)若系統運行過程中從設備出現問題,則進行步驟6)判斷是否進行強制切換,若是,則切換為主設備控制輸出。
本發明中進行主設備和從設備切換的方法用到的信號參數,參見表一;
表一
權利要求
1.一種雙餘度計算機故障處理的切換方法,其特徵在於所述方法包括以下步驟1)對系統上電,主設備控制禁止,從設備控制禁止;2)從設備對系統狀態進行實時監控;3)從設備判斷主設備是否工作正常;若是,則主設備控制輸出,從設備進行備份監控; 若否,則進行步驟4);4)主設備將故障信息通知從設備;5)主設備控制禁止,從設備實現切換控制輸出,並同時對主設備監控。
2.根據權利要求1所述的雙餘度計算機故障處理的切換方法,其特徵在於所述步驟 5)之後還包括步驟6)若系統運行過程中從設備出現問題,則進行步驟6)判斷是否進行強制切換,若是,則切換為主設備控制輸出。
3.根據權利要求1或2所述的雙餘度計算機故障處理的切換方法,其特徵在於所述步驟3)從設備判斷主設備是否工作正常的具體步驟是3. 1)從設備檢測主設備,首先判斷主設備是否電源失效,若是,則主設備的故障寄存器由『1,置為『0,,若否,則進行步驟3. 2);3. 2)判斷主設備是否有看門狗報警,若是,則主設備的故障寄存器由『1』置為『0』,若否,則進行步驟3. 3);3.3)判斷主設備是否軟體BIT錯誤,若是,則主設備的故障寄存器由『1』置為『0』,若否,則返回步驟3)重新進行。
4.根據權利要求3所述的雙餘度計算機故障處理的切換方法,其特徵在於所述步驟4)中通知的具體步驟是4. 1)主設備通過硬體將C_G0/N0g0離散量故障信號由高電平變為低電平; 4. 2)該C_G0/N0g0離散量經過光藕隔離後從低電平變為高電平;4.3)步驟2)中的高電平故障信號送入從設備的B_g0n0g0_in輸入,通知從設備主設備故障。5.根據權利要求4所述的雙餘度計算機故障處理的切換方法,其特徵在於所述步驟5)主設備控制禁止,從設備切換的具體步驟是5
. 1)從設備通過中斷通知從設備的應用程式主設備故障,需要切換到從設備; 5. 2)從設備硬體配置內部故障切換控制寄存器的狀態置為『0』,配置為切換狀態; 5. 3)切換控制寄存器輸出信號為低電平,表示由從設備進行系統控制; 5. 4)輸出的B_valid信號經過光藕隔離後,送入主設備&C_valid_in輸入控制主設備切換,主設備通過內部硬體將輸出控制禁止;5. 5)從設備內部的切換控制寄存器控制切換邏輯將從設備的輸出控制使能。
全文摘要
本發明提出了一種雙餘度計算機故障處理的切換方法,包括以下步驟1)對系統上電,主設備控制禁止,從設備控制禁止;2)從設備對系統狀態進行實時監控;3)從設備判斷主設備是否工作正常;若是,則主設備控制輸出,從設備進行備份監控;若否,則進行步驟4);4)主設備將故障信息通知從設備;5)主設備控制禁止,從設備實現切換控制輸出,並同時對主設備監控。本發明的一種雙餘度計算機故障處理的切換方法,採用離散量信號和FPGA實現故障邏輯,實時完成主從設備的故障判斷、故障信息傳遞及主從功能切換。
文檔編號G06F11/30GK102541697SQ20101062006
公開日2012年7月4日 申請日期2010年12月31日 優先權日2010年12月31日
發明者劉文學, 劉碩, 向建軍 申請人:中國航空工業集團公司第六三一研究所