數據錯誤修複方法、裝置和設備的製作方法

2023-06-01 16:16:16 1

專利名稱：數據錯誤修複方法、裝置和設備的製作方法
技術領域：
本發明涉及計算機技術領域，特別涉及一種數據錯誤修複方法、裝置和設備。
背景技術：
內存作為計算機系統中必備的部件，通常以內存條的形式存在於不同架構的系統中。在系統運行過程中，內存可能發生硬失效或軟失效。硬失效是指由於硬體問題引入的無法恢復的數據錯誤，軟失效是指由於數據跳變而引入的可以由上、下電或者重啟進行恢復的數據錯誤。而為了維護系統的正常運行，需要對硬失效和軟失效引入的數據錯誤進行修復。現有技術中的修複方法一般通過在內存條上增加ECC (Error Checking andCorrection，錯誤檢測和糾正)校驗晶片進行，當內存的數據出現數據錯誤，ECC檢測到該數據錯誤後，輸出正確的數據給用戶。在實現本發明的過程中，發明人發現現有技術至少存在以下問題:ECC僅是根據數據錯誤向用戶輸出正確的數據，而不對內存中的錯誤數據進行任何修復動作。通過ECC不能有效區分硬失效和軟失效，進而不能對錯誤數據修復，使得錯誤數據的累積而容易造成系統掛死、系統無法啟動等，影響正常業務的進行。

發明內容
為了解決軟、硬失效的區分和處理問題，本發明實施例提供了一種數據錯誤修複方法、裝置和設備。所述技術方案如下:第一方面，提供了一種數據錯誤修複方法，所述方法包括:判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。結合第一方面，本發明實施例的第一種可能實現方式中，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復，包括:如果所述內存中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。結合第一方面，本發明實施例的第二種可能實現方式中，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復，包括:如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；在結束巡檢之後，判斷所述內存中的數據錯誤是否已被修復；
如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。結合第一方面，本發明實施例的第三種可能實現方式中，如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢，包括:如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；根據所述巡檢地址對應的所述內存中的數據進行巡檢。結合第一方面，本發明實施例的第四種可能實現方式中，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復之後，所述方法還包括:當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存。結合第一方面，本發明實施例的第五種可能實現方式中，判斷內存中預設計數器是否溢出之前，所述方法還包括:當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；將所述發生數據錯誤的物理地址存儲至內存中，並對所述發生數據錯誤的物理地址進行數據回寫。第二方面，提供了一種數據錯誤修復裝置，所述裝置包括:判斷模塊，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；確定模塊，用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。結合第二方面，本發明實施例的第一種可能實現方式中，所述確定模塊用於如果所述內存中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。結合第二方面，本發明實施例的第二種可能實現方式中，所述確定模塊包括:巡檢單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；判斷單元，用於在結束巡檢之後，判斷所述內存中的數據錯誤是否已被修復；確定單元，用於如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；所述確定單元，用於如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。結合第二方面，本發明實施例的第三種可能實現方式中，所述巡檢單元包括:巡檢地址轉換子單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；巡檢子單元，用於根據所述巡檢地址對應的所述內存中的數據進行巡檢。
結合第二方面，本發明實施例的第四種可能實現方式中，所述裝置還包括:硬失效物理地址獲取模塊，用於當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；觸發模塊，用於觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存。結合第二方面，本發明實施例的第五種可能實現方式中，所述裝置還包括:數據錯誤物理地址獲取模塊，用於當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；存儲模塊，用於將所述發生數據錯誤的物理地址存儲至內存中；回寫模塊，用於對所述發生數據錯誤的物理地址進行數據回寫。第三方面，提供了一種數據錯誤修復設備，所述設備包括:內存，用於存儲數據以及發生數據錯誤的物理地址；處理器，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；所述處理器，還用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。本發明實施例提供的技術方案帶來的有益效果是:本發明實施例提供的數據錯誤修複方法、裝置和設備，通過判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。採用本發明實施例提供的技術方案，可以有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。

為了更清楚地說明本發明實施例中的技術方案，下面將對實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。圖1是本發明實施例中提供的一種數據錯誤修複方法流程圖；圖2是本發明實施例中提供的一種數據錯誤修複方法流程圖；圖3是本發明實施例中提供的一種數據錯誤修復裝置結構示意圖；圖4是本發明實施例中提供的一種數據錯誤修復設備結構示意圖。
具體實施例方式為使本發明的目的、技術方案和優點更加清楚，下面將結合附圖對本發明實施方式作進一步地詳細描述。本發明實施例中，終端設備指向用戶提供數據處理功能、語音和/或數據連通性的設備，包括無線終端或有線終端。無線終端可以是具有無線連接功能的手持式設備、或連接到無線數據機的其他處理設備，經無線接入網與一個或多個核心網進行通信的移動終端。例如，無線終端可以是行動電話(或稱為「蜂窩」電話)和具有移動終端的計算機。又如，無線終端也可以是可攜式、袖珍式、手持式、計算機內置的或者車載的移動裝置。再如，無線終端可以為移動站(英文為:mobile station)、接入點(英文為:access point)、或用戶裝備(英文為:user equipment,簡稱UE)等。圖1是本發明實施例中提供的一種數據錯誤修複方法流程圖，本發明實施例的執行主體是終端設備，參見圖1，該方法包括:101:判斷內存中預設計數器是否溢出，所述預設計數器用於存儲所述內存發生數據錯誤的物理地址；其中，預設計數器是預先設置在內存中的空間，該預設計數器的大小由技術人員在設計過程中進行設定，本發明實施例對此不作具體限定。優選地，該預設計數器每隔一定時間間隔對ECC寄存器進行讀取，當讀取到ECC寄存器中的標識位表示內存中的數據存在錯誤時，將該預設計數器的值加I。進一步地，每隔預設時長，該預設計數器的值減1，預設時長大於讀取的時間間隔。當預設計數器的數值超過溢出門限時，該預設計數器溢出。其中，該預設計數器涉及到的讀取的時間間隔、預設時長以及溢出門限等參數可以由技術人員進行設置，本發明實施例對此不作具體限定。終端設備判斷內存中預設計數器是否溢出時，可以由預設計數器的值超出溢出門限時觸發相應的指令，在接收到預設計數器在溢出時觸發相應的指令時，確定預設計數器溢出，否則，確定該預設計數器未溢出。優選地，該數據錯誤為單比特錯誤，當預設計數器溢出時，需要判斷內存中存儲的發生單比特數據錯誤的物理地址對應的數據的失效類型，並加以處理，以防止多比特數據錯誤的發生；當預設計數器未溢出時，內存中存儲的發生單比特數據錯誤的物理地址數量較少，可以不對內存中存儲的物理地址對應的數據進行處理。102:如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。其中，內存的失效類型分為軟失效和硬失效。軟失效的數據錯誤可以進行回寫，即將正確的數據寫至該軟失效對應的物理地址中；硬失效的數據錯誤不能進行回寫，只能通過人工的方式進行對應內存的更換。如果所述預設計數器溢出，終端設備需要對內存中存儲的物理地址對應的內存的失效類型進行判斷，以確定內存的失效類型。終端設備可以對內存中存儲的物理地址對應的數據進行反覆讀取，判斷內存中存儲的物理地址對應的數據是否被修復，如果該數據被修復，則該物理地址對應的內存的失效類型為軟失效；如果該數據未被修復，則該物理地址對應的內存的失效類型為硬失效。如，當對一個物理地址對應數據進行多次讀取後，通過檢測獲知該物理地址對應的數據仍然存在錯誤，則該物理地址對應的內存的失效類型為硬失效。優選地，判斷內存中存儲的物理地址對應的數據是否被修復可以由ECC寄存器進行檢測獲知。當確定內存中存儲的物理地址對應失效類型為軟失效時，則將正確的數據回寫至該軟失效對應的物理地址中，當確定內存中存儲的物理地址對應失效類型為硬失效時，則無法將正確的數據回寫至該硬失效對應的物理地址中，相應的，提示用戶該內存錯誤為硬失效，需要人工對該物理地址對應的內存進行更換，以防止多比特錯誤累積造成系統掛死等問題。本發明實施例提供的數據錯誤修複方法，通過判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。採用本發明實施例提供的技術方案，可以有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。圖2是本發明實施例中提供的一種數據錯誤修複方法流程圖，本發明實施例的執行主體是終端設備，數據錯誤為單比特數據錯誤為例進行說明。參見圖2，該方法包括:201:當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；當內存中發生單比特數據錯誤時，終端設備根據ECC檢測到的單比特數據錯誤，獲取單比特數據錯誤對應的物理地址。202:將所述發生數據錯誤的物理地址存儲至內存中，並對所述發生數據錯誤的物理地址進行數據回寫；具體地，終端設備在獲取到發生數據錯誤的物理地址後，將該發生數據錯誤的物理地址存儲至內存的同時,啟動需求清除(Demand Scrubbing)功能,在發生單比特數據錯誤的物理地址中回寫正確的數據，以實現對單比特數據錯誤的修復。當該發生的單比特數據錯誤對應的失效類型為軟失效時，理想狀態下，該需求清除功能可以將正確的數據回寫，當該發生的單比特數據錯誤對應的失效類型為硬失效時，該需求清除功能不能將正確的數據回寫。因此，終端設備需要進一步判斷發生單比特數據錯誤的內存的失效類型，如果是軟失效，則單比特數據錯誤已經被修復，如果是硬失效，則單比特數據錯誤未被修復，還需後續進一步處理。203:判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數，如果是，執行步驟204，如果否，繼續執行該步驟203 ；當預設計數器的值大於溢出門限，該預設計數器溢出。需要說明的是，當預設計數器未溢出時，則不進行後續步驟，終端設備繼續判斷預設計數器是否溢出。步驟201-202為可選步驟，將所述發生數據錯誤的物理地址存儲至內存可以作為步驟203的觸發條件，當對發生數據錯誤的物理地址進行存儲時，執行步驟203，而在本發明提供的另一實施例中，還可以是每隔預設時長執行步驟203，而不以對發生單比特錯誤並對發生數據錯誤的物理地址進行存儲為觸發條件。204:判斷所述內存中存儲的發生數據錯誤的物理地址中是否存在相同的物理地址，如果是，執行步驟205，如果否，執行步驟206 ；如果預設計數器溢出，終端設備讀取該內存中存儲的各個發生數據錯誤的物理地址，判斷各個發生數據錯誤的物理地址中是否存在相同的物理地址。如果判斷過程中確定存在兩個或者兩個以上相同的物理地址，則可以確定內存中存在相同的物理地址，如果不存在兩個或者兩個以上相同的物理地址，則可以確定內存中不存在相同的物理地址。205:如果所述內存中存在相同的物理地址，確定所述相同的物理地址對應的單比特數據錯誤的失效類型為硬失效，執行步驟211 ；根據步驟202可知，對於軟失效來說，在獲取到發生單比特數據錯誤的物理地址後，將該發生單比特數據錯誤的物理地址存儲至內存的同時，啟動需求清除(DemandScrubbing)功能,通過需求清除功能在發生單比特數據錯誤的物理地址中寫入正確的數據。因此，如果該發生單比特數據錯誤的失效類型為軟失效時，該發生單比特數據錯誤的物理地址中將被寫入正確的數據，當再次對該物理地址進行檢測時，該物理地址中的數據正確，則不將該物理地址寫入內存，也即是發生軟失效的物理地址僅會在內存中存儲一次；而如果該發生單比特數據錯誤的失效類型為硬失效時，由於數據回寫不能將正確的數據寫入該發生單比特數據錯誤的物理地址中，導致該物理地址的錯誤數據未能被修復，當再次對該物理地址進行檢測時，該物理地址將再次被寫入內存，因此，當該發生單比特數據錯誤的失效類型為硬失效時，該發生單比特數據錯誤的物理地址可能會多次存儲在內存中。由於發生單比特數據錯誤的物理地址可能會多次存儲在內存中，如果內存中存在兩個或兩個以上相同的物理地址，確定該相同的物理地址對應的單比特數據錯誤的失效類型為硬失效。206:如果所述內存中不存在相同的物理地址，將所述內存中的發生數據錯誤的物理地址轉換成巡檢地址；當終端設備啟動巡檢清除Patrol Scrubbing功能時,根據轉換的巡檢地址對該巡檢地址對應的內存數據進行巡檢。終端設備將內存中的發生數據錯誤的物理地址轉換成巡檢地址，便於根據該巡檢地址進行巡檢。具體地，將所述內存中的發生數據錯誤的物理地址轉換成巡檢地址包括:終端設備判斷內存中的發生數據錯誤的物理地址是否為內存地址，如果確定該內存中的發生數據錯誤的物理地址是內存地址，則讀取DRAM_RULE寄存器確定該內存所在的socket ;查詢TADO-TAD11寄存器確定Channel ID ;根據RIRWAYNESS寄存器和riri IvXoffset可以確定故障的 DIMM、Rank ID 和 Rank 內部地址，根據獲取的 socket ID、Channel ID、DIMM、RankID和Rank地址獲取巡檢地址。終端設備根據物理地址獲取巡檢地址的過程為本領域技術人員所熟知，本發明實施例不再贅述。如果內存中不存在相同的物理地址,則該內存中存儲的物理地址對應的單比特數據錯誤的類型可能是軟失效也可能是硬失效。207:根據所述巡檢地址對應的所述內存中的數據進行巡檢；具體地，終端設備停止系統自動的巡檢清除Patrol Scrubbing,將轉換後的巡檢地址寫入SCRUBADDRESSLO寄存器和SCRUBADDRESSHI寄存器，使能巡檢，根據SCRUBADDRESSLO寄存器和SCRUBADDRESSHI寄存器對轉換後的巡檢地址對應的內存中的數據的巡檢。在巡檢過程中，如果巡檢地址對應的內存數據存在數據錯誤，對該巡檢地址對應的內存中的數據進行回寫；如果巡檢地址對應的內存中數據正確，則不對該數據進行任何處理。步驟206-207是如果所述內存中不存在相同的物理地址，進行內存巡檢的過程。
208:在結束巡檢之後，判斷所述內存中的單比特數據錯誤是否已被修復，如果是，執行步驟209，如果否，執行步驟210 ；在終端設備對內存中和巡檢地址對應的數據巡檢結束後，讀取ECC寄存器中的標誌著是否存在單比特數據錯誤的標識位，如果ECC寄存器中的標識位表明巡檢地址對應內存中的數據存在錯誤，說明內存中的單比特數據錯誤未被修復；如果ECC寄存器中的標識位表明巡檢地址對應內存中的數據沒有錯誤，說明內存中的單比特數據錯誤已被修復。209:如果所述單比特數據錯誤已被修復，確定所述單比特數據錯誤的失效類型為軟失效，結束；如果根據ECC寄存器中的標識位確定內存中的單比特數據錯誤已被修復，說明在終端設備啟動需求清除(Demand Scrubbing)功能過程中，該單比特數據錯誤被糾正,確定該單比特數據錯誤的失效類型為軟失效。210:如果所述單比特數據錯誤未被修復，確定所述單比特數據錯誤的失效類型為硬失效;如果根據ECC寄存器中的標識位確定內存中的單比特數據錯誤未被修復，說明在終端設備啟動需求清除(Demand Scrubbing)功能過程中，該單比特數據錯誤未被糾正,確定該單比特數據錯誤的失效類型為硬失效。211:當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的單比特數據錯誤的物理地址；當確定所述內存的失效類型為硬失效時，終端設備獲取所述失效類型為硬失效的單比特數據錯誤的物理地址的過程可以為以下任一項:(I)終端設備通過對內存中的相同物理地址檢測，當存在相同的物理地址時確定內存的失效類型為硬失效時，終端設備直接讀取該相同的物理地址；(2)終端設備通對巡檢地址對應的數據進行巡檢，當巡檢後根據ECC寄存器中的標誌位確定所述內存的失效類型為硬失效時，終端設備從作業系統OS的mcelog文件中獲取該硬失效對應的數據的物理地址。212:觸發警報，以便提示用戶更換所述失效類型為硬失效的單比特數據錯誤的物理地址對應的內存。優選地，終端設備獲取到失效類型為硬失效的單比特數據錯誤的物理地址後，在顯示屏幕上顯示所述失效類型為硬失效的單比特數據錯誤的物理地址，並觸發警報，使得用戶在獲知該信息後，對失效類型為硬失效的單比特數據錯誤的物理地址對應的內存進行更換，避免硬失效的單比特數據錯誤累積，造成系統掛死，防止內存問題在單板集中復位或者升級時大量爆發。步驟204-212是如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復的過程。需要說明的是，本發明實施例的執行主體還可以是終端設備中的內存控制器。本發明實施例提供的數據錯誤修複方法，通過判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復採用本發明實施例提供的技術方案，可以有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。圖3是本發明實施例中提供的一種數據錯誤修復裝置結構示意圖，參見圖3，該裝置包括:判斷模塊301，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；確定模塊302，用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。所述確定模塊302用於如果所述內存中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。所述確定模塊302包括:巡檢單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；判斷單元，用於在結束巡檢之後，判斷所述內存中的數據錯誤是否已被修復；確定單元，用於如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；所述確定單元，用於如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。所述巡檢單元包括:巡檢地址轉換子單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；巡檢子單元，用於根據所述巡檢地址對應的所述內存中的數據進行巡檢。所述裝置還包括:硬失效物理地址獲取模塊303，用於當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；觸發模塊304，用於觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存。所述裝置還包括:數據錯誤物理地址獲取模塊305，用於當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；存儲模塊306，用於將所述發生數據錯誤的物理地址存儲至內存中；回寫模塊307，用於對所述發生數據錯誤的物理地址進行數據回寫。本發明實施例提供的數據錯誤修復裝置，通過判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。採用本發明實施例提供的技術方案，可以有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。需要說明的是:上述實施例提供的數據錯誤修復裝置在數據錯誤修復時，僅以上述各功能模塊的劃分進行舉例說明，實際應用中，可以根據需要而將上述功能分配由不同的功能模塊完成，即將設備的內部結構劃分成不同的功能模塊，以完成以上描述的全部或者部分功能。另外，上述實施例提供的數據錯誤修復裝置與數據錯誤修複方法實施例屬於同一構思，其具體實現過程詳見方法實施例，這裡不再贅述。圖4是本發明實施例中提供的一種數據錯誤修復設備結構示意圖。參見圖4，該數據錯誤修復設備包括:處理器401和內存402，處理器401，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存402發生數據錯誤進行計數；處理器401，用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存402的失效類型，以便後續進行相應地修復。內存402，用於存儲數據以及發生數據錯誤的物理地址。處理器401，用於如果所述內存402中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。處理器401，用於如果所述內存402中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；處理器401，用於在結束巡檢之後，判斷所述內存402中的數據錯誤是否已被修復；處理器401，用於如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；處理器401，用於如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。處理器401，用於如果所述內存402中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；處理器401，用於根據所述巡檢地址對應的所述內存402中的數據進行巡檢。處理器401，用於當確定所述內存402的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；處理器401，用於觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存402。處理器401，用於當內存402中發生數據錯誤時，獲取發生數據錯誤的物理地址；處理器401，用於將所述發生數據錯誤的物理地址存儲至內存402中，並對所述發生數據錯誤的物理地址進行數據回寫。本發明實施例提供的數據錯誤修復設備，通過判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。採用本發明實施例提供的技術方案，可以有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。本領域普通技術人員可以理解實現上述實施例的全部或部分步驟可以通過硬體來完成，也可以通過程序來指令相關的硬體完成，所述的程序可以存儲於一種計算機可讀存儲介質中，上述提到的存儲介質可以是只讀存儲器，磁碟或光碟等。以上所述僅為本發明的較佳實施例，並不用以限制本發明，凡在本發明的精神和原則之內，所作的任何修改、等同替換、改進等，均應包含在本發明的保護範圍之內。
權利要求
1.一種數據錯誤修複方法，其特徵在於，所述方法包括: 判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。
2.根據權利要求1所述的方法，其特徵在於，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復，包括: 如果所述內存中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。
3.根據權利要求1所述的方法，其特徵在於，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復，包括: 如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；在結束巡檢之後，判斷所述內存中的數據錯誤是否已被修復；如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。
4.根據權利要求3所述的方法，其特徵在於，如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢，包括: 如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；根據所述巡檢地址對應的所述內存中的數據進行巡檢。
5.根據權利要求1所述的方法，其特徵在於，如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復之後，所述方法還包括: 當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存。
6.根據權利要求1所述的方法，其特徵在於，判斷內存中預設計數器是否溢出之前，所述方法還包括: 當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；將所述發生數據錯誤的物理地址存儲至內存中，並對所述發生數據錯誤的物理地址進行數據回寫。
7.一種數據錯誤修復裝置，其特徵在於，所述裝置包括: 判斷模塊，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；確定模塊，用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。
8.根據權利要求7所述的裝置，其特徵在於，所述確定模塊用於如果所述內存中存儲的發生數據錯誤的物理地址中存在相同的物理地址，確定所述相同的物理地址對應的數據錯誤的失效類型為硬失效。
9.根據權利要求7所述的裝置，其特徵在於，所述確定模塊包括: 巡檢單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，進行內存巡檢；判斷單元，用於在結束巡檢之後，判斷所述內存中的數據錯誤是否已被修復；確定單元，用於如果所述數據錯誤未被修復，確定所述數據錯誤的失效類型為硬失效；所述確定單元，用於如果所述數據錯誤已被修復，確定所述數據錯誤的失效類型為軟失效。
10.根據權利要求9所述的裝置，其特徵在於，所述巡檢單元包括: 巡檢地址轉換子單元，用於如果所述內存中存儲的發生數據錯誤的物理地址中不存在相同的物理地址，將所述預設計數器中的物理地址轉換成巡檢地址；巡檢子單元，用於根據所述巡檢地址對應的所述內存中的數據進行巡檢。
11.根據權利要求7所述的裝置，其特徵在於，所述裝置還包括: 硬失效物理地址獲取模塊，用於當確定所述內存的失效類型為硬失效時，獲取所述失效類型為硬失效的數據錯誤的物理地址；觸發模塊，用於觸發警報，以便提示用戶更換所述失效類型為硬失效的數據錯誤的物理地址對應的內存。
12.根據權利要求7所述的裝置，其特徵在於，所述裝置還包括: 數據錯誤物理地址獲取模塊，用於當內存中發生數據錯誤時，獲取發生數據錯誤的物理地址；存儲模塊，用於將所述發生數據錯誤的物理地址存儲至內存中；回寫模塊，用於對所述發生數據錯誤的物理地址進行數據回寫。
13.一種數據錯誤修復設備，其特徵在於，所述設備包括: 內存，用於存儲數據以及發生數據錯誤的物理地址；處理器，用於判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；所述處理器，還用於如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。
全文摘要
本發明公開了一種數據錯誤修複方法、裝置和設備，屬於終端設備領域。所述方法包括判斷內存中預設計數器是否溢出，所述預設計數器用於對所述內存發生數據錯誤進行計數；如果所述預設計數器溢出，根據所述內存中存儲的發生數據錯誤的物理地址，確定所述內存的失效類型，以便後續進行相應地修復。本發明通過根據所述預設存儲空間中存儲的物理地址有效區分內存的失效類型，並根據失效類型進行修復，避免了數據錯誤累積造成的系統掛死或無法啟動等情況，保證了業務的正常進行。
文檔編號G06F11/14GK103218275SQ20131010531
公開日2013年7月24日申請日期2013年3月28日優先權日2013年3月28日
發明者傅汝丹申請人:華為技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

數據錯誤修複方法、裝置和設備的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法