中央伺服器、業務伺服器及其異常檢測方法和系統與流程
2023-05-05 06:07:27 1

本發明屬於伺服器技術領域,特別是涉及一種中央伺服器、業務伺服器及其異常檢測方法和系統。
背景技術:
大數據(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,需要經過處理模式的處理才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
集群一般由數量龐大的業務伺服器組成,集群中的大數據的分析處理,如通過對集群中各業務伺服器的系統特徵信息的分析處理,一般通過大數據平臺進行,以得到集群中業務伺服器的運行異常檢測結果。
但是,現有的集群中業務伺服器的運行異常檢測方法,存在著成本高且效率低下的問題。
技術實現要素:
本發明實施例解決的問題是如何在對集群中的業務伺服器進行異常檢測時節省成本,並提高效率。
為解決上述問題,本發明實施例提供了一種業務伺服器異常檢測方法,所述方法包括:提取自身的系統特徵信息並發送至預設的中央伺服器,以使得所述中央伺服器對集群中的業務伺服器的系統特徵信息進行匯總得到總系統特徵信息;接收所述中央伺服器發送的所述總系統特徵信息;基於接收所述中央伺服器發送的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算得到對應的檢測返回值;將計算得到的檢測返回值發送至所述中央伺服器,以使得所述中央伺服器根據所有業務伺服器發送的距離返回值確定存在異常的業務伺服器的信息。
可選地,所述基於接收所述中央伺服器發送的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算對應的檢測返回值,包括:。基於所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算自身所屬的聚簇;基於自身所屬的聚簇,計算自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離;基於計算得到的自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值。
可選地,所述系統特徵信息包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
本發明實施例還提供了另一種業務伺服器異常檢測方法,包括:接收集群中各業務伺服器發送的系統特徵信息;將所接收的集群中各業務伺服器的系統特徵信息進行匯總,得到所述集群的總系統特徵信息;將所得到的總系統特徵信息分別發送至所述集群中的業務伺服器,以使所述集群中的業務伺服器基於接收的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算對應的檢測返回值;基於所接收到的集群中的各業務伺服器發送的檢測返回值,確定存在異常的業務伺服器的信息。
可選地,所述基於所接收到的集群中的各業務伺服器發送的檢測返回值,確定存在異常的業務伺服器的信息,包括:將集群中的各業務伺服器發送的檢測返回值按照遞減的排序進行排序,並將排列在頭部的預設數量的檢測返回值對應的業務伺服器作為存在異常的業務伺服器。
可選地,所述方法還包括:基於所確定的存在異常的業務伺服器的信息,生成對應的告警信息並輸出。
可選地,所述系統特徵信息包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
本發明實施例還提供了一種業務伺服器,包括:提取單元,適於提取自身的系統特徵信息;第一發送單元,適於將所提取的自身的系統特徵信息發送至預設的中央伺服器,以使得所述中央伺服器對集群中的業務伺服器的系統特徵信息進行匯總得到總系統特徵信息;第一接收單元,適於接收所述中央伺服器發送的所述總系統特徵信息;計算單元,適於基於接收所述中央伺服器發送的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算得到對應的檢測返回值;第二發送單元,適於將計算得到的檢測返回值發送至所述中央伺服器,以使得所述中央伺服器根據所有業務伺服器發送的距離返回值確定存在異常的業務伺服器的信息。
可選地,所述計算單元,適於基於所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算自身所屬的聚簇;基於自身所屬的聚簇,計算自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離;基於計算得到的自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值。
可選地,所述系統特徵信息包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
本發明實施例還提供了一種中央伺服器,包括:第二接收單元,適於接收集群中各業務伺服器發送的系統特徵信息;匯總單元,適於將所接收的集群中各業務伺服器的系統特徵信息進行匯總,得到所述集群的總系統特徵信息;第三發送單元,適於將所得到的總系統特徵信息分別發送至所述集群中的業務伺服器,以使所述集群中的業務伺服器基於接收的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算對應的檢測返回值;確定單元,適於基於所接收到的集群中的各業務伺服器發送的檢測返回值,確定存在異常的業務伺服器的信息。
可選地,所述確定單元,適於將集群中的各業務伺服器發送的檢測返回值按照遞減的排序進行排序,並將排列在頭部的預設數量的檢測返回值對應的業務伺服器作為存在異常的業務伺服器。
可選地,所述中央伺服器還包括:告警單元,適於基於所確定的存在異常的業務伺服器的信息,生成對應的告警信息並輸出。
可選地,所述系統特徵信息包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
本發明實施例還提供了一種業務伺服器異常檢測系統,包括多個上述的業務伺服器和上述的中央伺服器。
與現有技術相比,本發明的技術方案具有以下的優點:
上述的方案,通過集群中的各業務伺服器將自身的系統特徵信息發送至預設的中央伺服器,所述中央伺服器對集群中所有業務伺服器的系統特徵信息進行將匯總得到集群總特徵信息並發送至集群中的各業務伺服器,再由集群中的各業務伺服器基於所接收的總系統特徵信息與自身的系統特徵信息,計算得到自身的異常檢測結果,由於無需搭建專門的數據分析平臺便可以對集群中的業務伺服器進行異常檢測,因而可以節省成本,並可以提高效率。
附圖說明
圖1是本發明實施例中一種的業務伺服器異常檢測方法的流程圖;
圖2是本發明實施例中另一種的業務伺服器異常檢測方法的流程圖;
圖3是本發明實施例中的一種業務伺服器異常檢測系統的結構示意圖;
圖4是本發明實施例中的一種業務伺服器異常檢測方法對應的信令流程圖;
圖5是本發明實施例中的業務伺服器的結構示意圖;
圖6是本發明實施例中的中央伺服器的結構示意圖。
具體實施方式
正如背景技術所言,現有的集群中業務伺服器的運行異常檢測方法,一般通過搭建專門的數據處理平臺或者通過專門設置的一臺伺服器對集群中的所有業務伺服器的系統特徵信息進行提取和分析,以得到集群中各業務伺服器的運行異常檢測結果。
但是,採用上述的方式,一方面,搭建專門的數據處理平臺,需要消耗大量的資源,存在成本高的問題;另一方面,採用單臺伺服器對集群中數量龐大的業務伺服器的系統特徵信息進行分析處理,存在著效率低下的問題。
為解決上述問題,本發明實施例中的技術方案通過集群中的各業務伺服器將自身的系統特徵信息發送至預設的中央伺服器,所述中央伺服器對集群中所有業務伺服器的系統特徵信息進行將匯總得到集群總特徵信息並發送至集群中的各業務伺服器,再由集群中的各業務伺服器基於所接收的總系統特徵信息與自身的系統特徵信息,計算得到自身的異常檢測結果,可以節省成本,並可以提高效率。
為使本發明的上述目的、特徵和優點能夠更為明顯易懂,下面結合附圖對本發明的具體實施例做詳細的說明。
圖1是本發明實施例中的一種業務伺服器異常檢測方法的流程圖。如圖1所示的業務伺服器異常檢測方法,可以包括:
步驟S101:提取自身的系統特徵信息並發送至預設的中央伺服器。
在具體實施中,集群中的業務伺服器可以分別提取自身的系統特徵信息並發送至預設的中央伺服器,從而可以使得所述中央伺服器可以獲取集群中所有業務伺服器的系統特徵信息並進行匯總,以得到對應的總系統特徵信息。
在具體實施中,業務伺服器所提取的自身的系統特徵信息可以業務伺服器的異常檢測的需要進行設置,如包括系統日誌、應用日誌、進程、流量、CPU用量以及內存用量的信息等。
步驟S102:接收所述中央伺服器發送的所述總系統特徵信息。
在具體實施中,所述中央伺服器在接收到集群中的所有業務伺服器發送的集群總特徵信息時,可以將所接收的集群中的所有業務伺服器的總系統特徵信息進行匯總,並分別發送至集群中的各業務伺服器,以使得集群中的各業務伺服器可以獲取所述總系統特徵信息。
步驟S103:基於接收所述中央伺服器發送的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算得到對應的檢測返回值。
在具體實施中,業務伺服器在接收到中央伺服器發送的集群總特徵信息時,便可以基於所接收的總系統特徵信息以及自身的系統特徵信息,計算得到對應的檢測返回值並發送至中央伺服器,使得中央伺服器可以獲取對應的檢測返回值。
步驟S104:將計算得到的檢測返回值發送至所述中央伺服器,以使得所述中央伺服器根據所有業務伺服器發送的距離返回值確定存在異常的業務伺服器的信息。
在具體實施中,各業務伺服器在計算得到對應的檢測返回值時,可以將對應的檢測返回值發送至中央伺服器,以使得中央伺服器可以基於各業務伺服器基於各業務伺服器的檢測返回值確定集群中存在異常的業務伺服器的信息。
圖2示出了本發明實施例中的另一種業務伺服器異常檢測方法的流程圖。參見圖2,本發明實施例中的業務伺服器異常檢測方法,可以具體採用如下的操作實現:
步驟S201:接收集群中各業務伺服器發送的系統特徵信息。
在具體實施中,在進行集群中的業務伺服器的異常檢測時,可以首先接收集群中的各業務伺服器發送的系統特徵信息。
步驟S202:將所接收的集群中各業務伺服器的系統特徵信息進行匯總,得到所述集群的總系統特徵信息。
在具體實施中,中央伺服器在接收到各業務伺服器發送的各自的系統特徵信息時,可以將所接收的集群中的所有業務伺服器的系統特徵信息進行匯總,從而得到集群的總系統特徵信息。例如,中央伺服器可以生成對應的列表,在所述列表中包括集群中的各個業務伺服器的標識以及該業務伺服器的系統特徵信息。其中,各個業務伺服器的標識可以為IP位址等。
步驟S203:將所得到的總系統特徵信息分別發送至所述集群中的業務伺服器。
在具體實施中,中央伺服器在匯總得到對應的總系統特徵信息時,可以將所述總系統特徵信息分別發送至集群中的各個業務伺服器,以使所述集群中的業務伺服器可以基於所接收的總系統特徵信息與自身的系統特徵信息,計算得到自身對應的檢測返回值並發送。
步驟S204:基於所接收到的集群中的各業務伺服器發送的檢測返回值,確定存在異常的業務伺服器的信息。
在具體實施中,中央伺服器可以基於集群中各個業務伺服器發送的檢測返回值的信息,確定集群中存在異常的業務伺服器的信息。
上述的方案,通過集群中的各業務伺服器將自身的系統特徵信息發送至預設的中央伺服器,以使得所述中央伺服器對集群中所有業務伺服器的系統特徵信息進行將匯總得到集群總特徵信息並發送至集群中的各業務伺服器,再由集群中的各業務伺服器基於所接收的總系統特徵信息與自身的系統特徵信息,計算得到自身的異常檢測結果,由於無需搭建專門的數據分析平臺便可以是集群中業務伺服器的異常檢測,因而可以節省成本,並可以提高效率。
下面將對本發明實施例中的業務伺服器異常檢測方法進行詳細的介紹。
為了便於理解,下面首先對本發明實施例中的業務伺服器異常檢測系統的結構進行介紹。
參見圖3,本發明實施例中的一種業務伺服器異常檢測系統可以包括由多個業務伺服器3011~301n組成的集群和中央伺服器302。其中,集群中的業務伺服器3011~301n分別與中央伺服器302連接。
參見圖4,本發明實施例中的一種業務伺服器異常檢測方法,用於對集群中的所有的業務伺服器的運行異常狀態進行檢測,具體可以採用如下的操作實現:
步驟S401:集群中的業務伺服器提取自身的系統特徵信息並發送至中央伺服器。
在具體實施中,在進行業務伺服器異常檢測時,可以首先設定相應的檢測周期,當達到對應的檢測周期時,可以啟動業務伺服器的異常檢測。此時,確定達到對應的檢測周期時,集群中的各業務伺服器可以分別按照對應的系統特徵信息的設置,從自身的系統中提取對應的系統特徵信息,作為自身的系統特徵信息並發送至中央伺服器。其中,所設置的檢測周期可以根據需要,如客戶的需求進行設置等。
步驟S402:所述中央伺服器接收業務伺服器的總系統特徵信息並進行匯總得到對應的總系統特徵信息。
步驟S403:所述中央伺服器將所述總系統特徵信息發送至集群中的各個業務伺服器。
在具體實施中,中央伺服器在接收到集群中的所有業務伺服器發送的集群總特徵信息時,可以將所接收的集群中的所有業務伺服器的總系統特徵信息進行匯總,並分別發送至集群中的各業務伺服器,以使得集群中的各業務伺服器可以獲取所述總系統特徵信息。
步驟S404:所述業務伺服器接收所述總系統特徵信息。
在具體實施中,集群中的各個業務伺服器所接收的系統總特徵信息中不僅包括集群中其他業務伺服器的系統特徵信息,還包括自身的系統總特徵信息。
步驟S405:各個業務伺服器基於所接收到的系統總特徵信息與自身的系統特徵信息,確定自身所屬的聚簇,並計算自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離。
在具體實施中,集群中的各個業務伺服器在接收到所述總系統特徵信息時,採用相應的聚類算法確定自身所屬的聚簇,也即是確定與自身屬於同一聚簇中的其他業務伺服器的信息。
當確定自身所屬聚簇中的其他業務伺服器的信息時,各個業務伺服器可以採用自身的系統特徵信息和聚簇中其他業務伺服器的系統特徵信息以及自身的系統特徵信息,計算自身的系統特徵信息與聚簇中其他業務伺服器的系統特徵信息之間的距離。
步驟S406:所述業務伺服器基於計算自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值。
在具體實施中,當計算得到自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離時,各個業務伺服器可以採用計算得到自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值。
在具體實施中,各個業務伺服器可以採用計算得到的自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值的方法可以根據實際的需要進行選取。例如,可以將計算得到的自身的系統特徵信息與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離進行相加,得到對應的檢測返回值等。
步驟S407:所述業務伺服器將計算得到的對應的檢測返回值發送至中央伺服器。
在具體實施中,當計算得到對應的檢測返回值時,集群中的各個業務伺服器可以將對應的檢測返回值發送至中央伺服器。
步驟S408:所述中央伺服器接收集群中各業務伺服器發送的檢測返回值的信息。
在具體實施中,中央伺服器所接收的檢測返回值與集群中的各個業務伺服器一一對應。
步驟S409:所述中央伺服器基於所接收的集群中各業務伺服器的檢測返回值確定存在異常的業務伺服器的信息。
在具體實施中,當接收到集群中各業務伺服器的檢測返回值時,中央伺服器可以基於集群中各業務伺服器的檢測返回值確定存在異常的業務伺服器。其中,系統特徵信息與聚簇中其他業務伺服器的系統特徵信息之間的距離越大時,也即聚簇中的離群點對應的檢測返回值也較大。因此,可以將集群中各業務伺服器的檢測返回值進行排序,並將數值較大的預設數量的檢測返回值對應的業務伺服器,作為存在異常的業務伺服器。
步驟S410:基於確定存在異常的業務伺服器的信息,生成對應的告警信息並輸出。
在具體實施中,中央伺服器在確定集群中存在異常的離群點的信息時,便可以生成對應的告警信息並輸出,從而可以使得用戶獲取存在異常的業務伺服器的信息,以便客戶可以採取相應的措施消除業務伺服器的運行異常,從而可以提高集群的運行可靠性。
採用上述的方案對集群中業務伺服器進行異常檢測,可以顯著提高異常檢測的速度。以集群中包括20000臺業務伺服器為例,採用本發明實施例中異常檢測方法時,最消耗計算資源的地方在於聚簇算法中需要計算每個業務伺服器與其他業務伺服器之間的距離。其中,當計算一臺業務伺服器與19999臺其他業務伺服器之間的距離分別需要0.4秒時,採用現有技術中的方法,需要消耗的時間為:0.4*20000=2.2小時。但是,採用本發明實施例中的伺服器異常檢測方法,每臺業務伺服器僅消耗0.4秒上傳對應的檢測返回值,中央伺服器僅需做一個20000個數值的檢測返回值的排序即可得到對應的異常檢測結果,因而可以提高業務伺服器的異常檢測速度。
上述對本發明實施例中的業務伺服器異常檢測方法進行了詳細的描述,下面將對上述的方法對應的裝置進行介紹。
圖5示出了本發明實施例中的一種業務伺服器的結構。參見圖5,本發明實施例中的一種業務伺服器500可以包括提取單元501、第一發送單元502、第一接收單元503、計算單元504和第二發送單元505,其中:
提取單元501,適於提取自身的系統特徵信息。
第一發送單元502,適於將所提取的自身的系統特徵信息發送至預設的中央伺服器,以使得所述中央伺服器對集群中的業務伺服器的系統特徵信息進行匯總得到總系統特徵信息。
第一接收單元503,適於接收所述中央伺服器發送的所述總系統特徵信息。
計算單元504,適於基於接收所述中央伺服器發送的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算得到對應的檢測返回值。
第二發送單元505,適於將計算得到的檢測返回值發送至所述中央伺服器,以使得所述中央伺服器根據所有業務伺服器發送的距離返回值確定存在異常的業務伺服器的信息。
在本發明一實施例中,所述計算單元504,適於基於所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算自身所屬的聚簇;基於自身所屬的聚簇,計算自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離;基於計算得到的自身的系統特徵系統與所屬聚簇中其他業務伺服器的系統特徵信息之間的距離,計算得到對應的檢測返回值。
在具體實施中,所述系統特徵信息可以包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
圖6示出了本發明實施例中的一種中央伺服器的結構。參見圖6,一種中央伺服器600可以包括第二接收單元601、匯總單元602、第三發送單元603和確定單元604,其中:
第二接收單元601,適於接收集群中各業務伺服器發送的系統特徵信息。
匯總單元602,適於將所接收的集群中各業務伺服器的系統特徵信息進行匯總,得到所述集群的總系統特徵信息。
第三發送單元603,適於將所得到的總系統特徵信息分別發送至所述集群中的業務伺服器,以使所述集群中的業務伺服器基於接收的所述總系統特徵信息中其他業務伺服器的系統特徵信息與自身的系統特徵信息,計算對應的檢測返回值。
確定單元604,適於基於所接收到的集群中的各業務伺服器發送的檢測返回值,確定存在異常的業務伺服器的信息。
在具體實施中,所述確定單元,適於將集群中的各業務伺服器發送的檢測返回值按照遞減的排序進行排序,並將排列在頭部的預設數量的檢測返回值對應的業務伺服器作為存在異常的業務伺服器。
在本發明一實施例中,為了使得用戶可以及時地獲知業務伺服器的異常信息,所述中央伺服器600還可以包括告警單元605,其中:
告警單元605,適於基於所確定的存在異常的業務伺服器的信息,生成對應的告警信息並輸出。
在具體實施中,所述系統特徵信息包括系統日誌、應用日誌、進程、流量、CPU用量和內存用量。
採用本發明實施例中的上述方案,通過集群中的各業務伺服器將自身的系統特徵信息發送至預設的中央伺服器,以使得所述中央伺服器對集群中所有業務伺服器的系統特徵信息進行將匯總得到集群總特徵信息並發送至集群中的各業務伺服器,再由集群中的各業務伺服器基於所接收的總系統特徵信息與自身的系統特徵信息,計算得到自身的異常檢測結果,由於無需搭建專門的數據分析平臺便可以是集群中業務伺服器的異常檢測,因而可以節省成本,並可以提高效率。
本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關的硬體來完成,該程序可以存儲於計算機可讀存儲介質中,存儲介質可以包括:ROM、RAM、磁碟或光碟等。
以上對本發明實施例的方法及系統做了詳細的介紹,本發明並不限於此。任何本領域技術人員,在不脫離本發明的精神和範圍內,均可作各種更動與修改,因此本發明的保護範圍應當以權利要求所限定的範圍為準。