一種故障處理的方法及裝置與流程
2023-06-09 10:13:06 3

本發明實施例涉及雲計算數據中心技術領域,特別是涉及一種故障處理的方法及裝置。
背景技術:
隨著雲計算技術的普及,多種基於雲計算平臺的數據中心應運而生,其聚合了大量硬體資源和軟體資源。為了保證雲數據中心的正常運轉,必須對整個雲數據中心實施全方位監控。雲數據中心中大量的軟硬體資源,給對其的監控及管理帶來了巨大的挑戰,對這些資源的狀態進行實時準確的監控顯得尤為重要。
目前,通常採用基於nagios或shinken等開源監控系統構建雲數據中心監控系統,並通過該監控系統對各個資源進行實時監控,可以得到各資源的運行狀態與健康狀況。
現有技術中,當監控系統監測出某個資源出現故障時,監控系統會發送通知至運維人員,運維人員根據故障報告的詳細信息進行故障定位與排除操作。由於數據中心的資源數量巨大,資源種類較多,各個資源出現故障的情況也千差萬別,所以為解決處理故障,運維人員需要掌握大量的故障處理解決方案,增加了運維人員在日常的排查解決故障的難度,並且當出現故障時,故障不能及時被處理,在一定程度上降低了工作效率。
因此,如何提供一種解決上述技術問題的故障處理的方法及裝置成為本領域的技術人員目前需要解決的問題。
技術實現要素:
本發明實施例的目的是提供一種故障處理的方法及裝置,在使用過程中降低了工作人員的工作量,保障了故障處理的及時性,提高了工作效率。
為解決上述技術問題,本發明實施例提供了一種故障處理的方法,包括:
獲取監控系統發送的故障信息;所述故障信息包括故障日誌及資源類型;
依據所述故障信息從預先建立的運維資料庫中找到故障預處理方案;
將所述故障預處理方案發送至用戶終端,以便用戶依據所述故障預處理方案確定出最終故障處理方案,並對故障進行處理。
可選的,所述依據所述故障信息從預先建立的運維資料庫中找到故障預處理方案的過程為:
依據所述故障信息從預先建立的運維資料庫中存儲的各個故障處理方案中篩選出與所述故障信息對應的各個故障處理方案;
依據預設規則從與所述故障信息對應的各個所述故障處理方案中確定出故障預處理方案。
可選的,所述依據預設規則從與所述故障信息對應的各個所述故障處理方案中確定出故障預處理方案的過程為:
分別計算與所述故障信息對應的各個所述故障處理方案與所述故障信息的匹配度;
依據大小關係將各個所述匹配度進行排序;
獲取最高匹配度,並將最高匹配度對應的故障處理方案作為故障預處理方案。
可選的,所述依據預設規則從與所述故障信息對應的各個所述故障處理方案中確定出故障預處理方案的過程為:
獲取用戶預先輸入的、與所述故障信息對應的各個所述故障處理方案的評分值;
將各個評分值從大至小進行排序;
獲取最高評分值,並將所述最高評分值對應的故障處理方案作為故障預處理方案。
可選的,還包括:
獲取用戶輸入的與所述故障信息對應的所述最終故障處理方案;
將所述最終故障處理方案發送至所述運維資料庫中進行存儲。
為解決上述技術問題,本發明實施例提供了一種故障處理的裝置,包括:
獲取模塊,用於獲取監控系統發送的故障信息;所述故障信息包括故障日誌及資源類型;
查找模塊,用於依據所述故障信息從預先建立的運維資料庫中找到故障預處理方案;
發送模塊,用於將所述故障預處理方案發送至用戶終端,以便用戶依據所述故障預處理方案確定出最終故障處理方案,並對故障進行處理。
可選的,所述查找模塊包括:
篩選單元,用於依據所述故障信息從預先建立的運維資料庫中存儲的各個故障處理方案中篩選出與所述故障信息對應的各個故障處理方案;
確定單元,用於依據預設規則從與所述故障信息對應的各個所述故障處理方案中確定出故障預處理方案。
可選的,所述的故障處理的裝置,所述獲取模塊,還用於獲取用戶輸入的與所述故障信息對應的所述最終故障處理方案;
所述發送模塊,還用於將所述最終故障處理方案發送至所述運維資料庫中進行存儲。
本發明實施例提供了一種故障處理的方法及裝置,包括獲取監控系統發送的故障信息;故障信息包括故障日誌及資源類型;依據故障信息從預先建立的運維資料庫中找到故障預處理方案;將故障預處理方案發送至用戶終端,以便用戶依據故障預處理方案確定出最終故障處理方案,並對故障進行處理。
可見,本發明實施例可以通過監控系統發送的故障信息從運維資料庫中自動找出與該故障信息相對應的故障預處理方案,並將該故障預處理方案推送至用戶終端,用戶可以將該故障預處理方案作為參考依據,從而得出用於處理相應故障的最終故障處理方案,並對故障進行處理。本發明實施例在使用過程中降低了工作人員的工作量,保障了故障處理的及時性,提高了工作效率。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對現有技術和實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例提供的一種故障處理的方法的流程示意圖;
圖2為本發明實施例提供的一種故障處理的裝置的結構示意圖。
具體實施方式
本發明實施例提供了一種故障處理的方法及裝置,在使用過程中降低了工作人員的工作量,保障了故障處理的及時性,提高了工作效率。
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
請參照圖1,圖1為本發明實施例提供的一種故障處理的方法的流程示意圖。
該方法包括:
s11:獲取監控系統發送的故障信息;故障信息包括故障日誌及資源類型;
s12:依據故障信息從預先建立的運維資料庫中找到故障預處理方案;
s13:將故障預處理方案發送至用戶終端,以便用戶依據故障預處理方案確定出最終故障處理方案,並對故障進行處理。
需要說明的是,可以通過全文搜尋引擎elasticsearch建立運維資料庫,具體可以通過將日常解決故障的方法整理歸納後存儲至運維資料庫中,即將故障的詳細信息、故障對應的資源類型等元數據信息及相應的故障處理方案相對應的存儲至運維資料庫中,並且該運維資料庫可以與監控系統進關聯。
監控系統實時對各個資源的運行狀態進行監控,當某個資源出現故障時,則監控系統得到該資源的故障信息,包括資源發生故障的故障日誌和資源類型,故障日誌包括故障時間、問題等信息。依據故障信息中的故障日誌及資源類型可以自動關聯至運維資料庫中,與運維資料庫中的各個故障處理方案進行匹配,進一步可以得到與當前故障信息對應的故障預處理方案,該故障預處理方案可以為用戶(及運維人員)處理該故障提供依據。運維人員可以根據系統提供的故障預處理方案、故障信息對中的故障日誌及資源類型得出準確的故障處理方案,該故障處理方案即為最終故障處理方案,並進一步根據最終故障處理方案對該故障進行處理。
本發明實施例提供了一種故障處理的方法,包括獲取監控系統發送的故障信息;故障信息包括故障日誌及資源類型;依據故障信息從預先建立的運維資料庫中找到故障預處理方案;將故障預處理方案發送至用戶終端,以便用戶依據故障預處理方案確定出最終故障處理方案,並對故障進行處理。
可見,本發明實施例可以通過監控系統發送的故障信息從運維資料庫中自動找出與該故障信息相對應的故障預處理方案,並將該故障預處理方案推送至用戶終端,用戶可以將該故障預處理方案作為參考依據,從而得出用於處理相應故障的最終故障處理方案,並對故障進行處理。本發明實施例在使用過程中降低了工作人員的工作量,保障了故障處理的及時性,提高了工作效率。
本發明實施例公開了一種故障處理的方法,相對於上一實施例,本實施例對技術方案作了進一步的說明和優化。具體的:
進一步的,在上述實施例中的s12中依據故障信息從預先建立的運維資料庫中找到故障預處理方案的過程為:
s121:依據故障信息從預先建立的運維資料庫中存儲的各個故障處理方案中篩選出與故障信息對應的各個故障處理方案;
s122:依據預設規則從與故障信息對應的各個故障處理方案中確定出故障預處理方案。
可以理解的是,依據故障信息中的故障日誌及資源類型與運維資料庫中的各個故障處理方案進行匹配後可能會得到多個與該故障信息對應的故障處理方案,但是,這多個故障處理方案的參考價值可能不同,所以可以按照預設規則從篩選出的這些故障處理方案中確定出最具有參考價值的故障處理方案,並將該故障處理方案作為故障預處理方案發送至用戶端,以便為用戶提供出參考依據。
更進一步的,上述s122中依據預設規則從與故障信息對應的各個故障處理方案中確定出故障預處理方案的過程,具體可以為:
分別計算與故障信息對應的各個故障處理方案與故障信息的匹配度;
依據大小關係將各個匹配度進行排序;
獲取最高匹配度,並將最高匹配度對應的故障處理方案作為故障預處理方案。
具體的,可以分別計算出該故障信息與篩選出的各個故障處理方案的匹配度,根據匹配度的大小可以判斷該故障處理方案相對於本次需要處理的故障的參考價值的大小,匹配度越大,則參考價值就越大,匹配度越小,參考價值就越小。得到各個匹配度後可以按照大小進行排序從而找出匹配度最高的故障處理方案,該故障處理方案即為故障預處理方案,進一步將該故障預處理方案發送至用戶端,以供用戶參考。
可選的,上述s122中依據預設規則從與故障信息對應的各個故障處理方案中確定出故障預處理方案的過程,具體還可以為:
獲取用戶預先輸入的、與故障信息對應的各個故障處理方案的評分值;
將各個評分值從大至小進行排序;
獲取最高評分值,並將最高評分值對應的故障處理方案作為故障預處理方案。
需要說明的是,用戶可以對每次推送的故障預處理方案進行評分,並且評分值與相應的故障預處理方案對應的保存至運維資料庫中,針對於每次出現的故障系統均會為該故障推送一個故障預處理方案,運維人員依據該故障預處理方案對故障進行運維處理,並且可以根據該故障預處理方案所實現的參考價值的大小對該故障預處理方案進行評分,評分越高,則越說明該故障預處理方案對本次待處理的故障的參考價值就越大,當下一次出現類似故障時被推送的機率越高。
因此,本發明實施例中不僅可以通過匹配度確定故障預處理方案,還可以通過與各個故障處理方案對應的評分值判斷哪個故障處理方案對本次待處理的故障的參考價值較大。
當然,本發明實施例中不僅限於採用匹配度或評分值的方式確定故障預處理方案,也可以通過其他的方式確定出與當前故障對應的故障預處理方案,具體採用哪種方式,本發明實施例對此不做特殊的限定,能實現本發明實施例的目的即可。
可選的,該方法還包括:
s14:獲取用戶輸入的與故障信息對應的最終故障處理方案;
s15:將最終故障處理方案發送至運維資料庫中進行存儲。
可以理解的是,為了使運維資料庫中存儲的故障處理方案更加完善,以便出現故障時可以推送出更加精確的故障預處理方案,所以本發明實施例中還可以將用戶確定的與本次故障對應的最終故障解決方案存儲至運維資料庫中,存儲格式為故障信息、資源類型及解決方案等信息。
還需要說明的是,本發明實施例可以實現智能推送,通過智能推送故障處理方案可以快速的定位與解決問題,在一定程度上有效的減輕了工作人員的負擔,提高了運維資料庫的實用性,保證了設備故障處理的準確性和及時性。
另外,本發明實施例中的運維資料庫可以隨著時間的推移,運維資料庫中所存到的故障處理方案越來越完善,所解決的故障也越來越多,從而當故障出現時,所推薦的故障處理方案的準確度也會越來越高,其價值也會越來越大。
相應的本發明實施例還公開了一種故障處理的裝置,具體請參照圖2,圖2為本發明實施例提供的一種故障處理的裝置的結構示意圖。在上述實施例的基礎上:
該裝置包括:
獲取模塊1,用於獲取監控系統發送的故障信息;故障信息包括故障日誌及資源類型;
查找模塊2,用於依據故障信息從預先建立的運維資料庫中找到故障預處理方案;
發送模塊3,用於將故障預處理方案發送至用戶終端,以便用戶依據故障預處理方案確定出最終故障處理方案,並對故障進行處理。
可選的,查找模塊2包括:
篩選單元,用於依據故障信息從預先建立的運維資料庫中存儲的各個故障處理方案中篩選出與故障信息對應的各個故障處理方案;
確定單元,用於依據預設規則從與故障信息對應的各個故障處理方案中確定出故障預處理方案。
可選的,的故障處理的裝置,獲取模塊1,還用於獲取用戶輸入的與故障信息對應的最終故障處理方案;
發送模塊3,還用於將最終故障處理方案發送至運維資料庫中進行存儲。
需要說明的是,本發明實施例提供了一種故障處理的裝置,可以通過監控系統發送的故障信息從運維資料庫中自動找出與該故障信息相對應的故障預處理方案,並將該故障預處理方案推送至用戶終端,用戶可以將該故障預處理方案作為參考依據,從而得出用於處理相應故障的最終故障處理方案,並對故障進行處理。本發明實施例在使用過程中降低了工作人員的工作量,保障了故障處理的及時性,提高了工作效率。
另外,對於本發明實施例中所涉及到的故障處理方法的具體介紹,請參照上述方法實施例,本申請在此不再贅述。
本說明書中各個實施例採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對於實施例公開的裝置而言,由於其與實施例公開的方法相對應,所以描述的比較簡單,相關之處參見方法部分說明即可。
還需要說明的是,在本說明書中,諸如術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
對所公開的實施例的上述說明,使本領域專業技術人員能夠實現或使用本發明。對這些實施例的多種修改對本領域的專業技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發明的精神或範圍的情況下,在其他實施例中實現。因此,本發明將不會被限制於本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的範圍。