一種集群的並行業務組控制和管理的方法
2023-05-22 21:35:26 2
一種集群的並行業務組控制和管理的方法
【專利摘要】一種集群的並行業務組控制和管理的方法,包括集群中存在並行業務組時對業務組進行正確的控制和管理,首先,能控制並行組的同時啟動和停止;其次,正確的記錄業務組在各個節點上的狀態;再次,在業務組在某個節點上異常時能夠進行異常操作,集群中的某個節點作為普通的業務節點的同時還作為管理節點存在,在並行業務組啟動或者停止時,集群的管理節點根據用戶配置信息,把啟動或者停止組的命令發送到指定的伺服器上,通知需要啟動業務組的伺服器啟動或者停止該業務組;集群的管理節點會收集每個伺服器上業務組的狀態,通過組的狀態的標誌位分別記錄各個狀態;在並行業務組在某個伺服器上異常時,管理節點會觸發該服務上依賴並行業務組的其他業務組進行切換,保證對應的依賴業務組的正常提供服務;控制並行組的同時啟動和停止。
【專利說明】一種集群的並行業務組控制和管理的方法
【技術領域】
[0001]本發明涉及計算機應用【技術領域】,具體地說是一種集群的並行業務組控制和管理的方法。
【背景技術】
[0002]高可用集群系統是指能夠保證業務24小時不中斷,在系統發生問題或者應用軟體發生問題時,能夠快速恢復業務,儘可能將宕機時間控制在分鐘級別的系統。高可用集群系統由下至上主要包括以下幾個模塊:心跳模塊、資源監控模塊、資源管理模塊、分布式控制臺模塊和web服務模塊。
[0003]其中,資源管理模塊負責業務組及組資源的操作管理,用於操作和監控業務組資源,保證其可用性和可靠性。目前在高可用集群系統中,一個業務組在集群中的一臺伺服器上運行,這樣集群管理模塊只記錄業務組在對應伺服器上的唯一狀態。但是在一些特殊的需求中,一個業務組可能需要啟動在集群中的某些指定的或者全部的伺服器上,需要同時記錄所有伺服器上該業務組的狀態,並同時管理和控制這些伺服器上的該業務組,原有的管理和控制方式已經不能滿足要求了。因此,引入並行業務組的概念成為必要,發明一種管理和控制並行業務組的方法也成為理所當然。並行業務組是指某個業務組需要在集群中的多個或者全部的伺服器上運行的組,並行業 務組的管理和控制需要遍及到所有運行了該業務組的所有伺服器上,保證及時監控各個伺服器上的業務組,並且及時進行各種操作。
【發明內容】
[0004]本發明的目的是提供一種集群的並行業務組控制和管理的方法。
[0005]本發明的目的是按以下方式實現的,包括解決集群中存在並行業務組時,對業務組進行正確的控制和管理,首先,能控制並行組的同時啟動和停止;其次,正確的記錄業務組在各個節點上的狀態;再次,在業務組在某個節點上異常時能夠進行異常操作,集群中的某個節點作為普通的業務節點的同時還作為管理節點存在,在並行業務組啟動或者停止時,集群的管理節點根據用戶配置信息,把啟動或者停止組的命令發送到指定的伺服器上, 通知需要啟動業務組的伺服器啟動或者停止該業務組;集群的管理節點會收集每個伺服器上業務組的狀態,通過組的狀態的標誌位分別記錄各個狀態;在並行業務組在某個伺服器上異常時,管理節點會觸發該服務上依賴並行業務組的其他業務組進行切換,保證對應的依賴業務組的正常提供服務;控制並行組的同時啟動和停止,其中:
並行業務組啟動流程包括如下幾步:
步驟1:用戶根據業務需求創建集群並創建一個並行業務組,完成後上傳配置文件到各個節點上,啟動集群服務。集群在啟動過程中會有一個最優的節點決策成管理節點; 步驟2:管理節點接收到了啟動並行組的命令,根據用戶生成的配置文件尋找需要啟動並行組的伺服器;
步驟3:管理節點組合消息# deSt=all#rd=…,其中rd表示將要啟動並行組的伺服器的組合,然後把消息發送給所有的節點,通知目的伺服器啟動並行組;
步驟4:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上啟動並行組,並且把並行組啟動的結果返回給管理節點;
步驟5:管理節點接收到每個目的伺服器的啟動結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值;
步驟6:管理節點告知用戶啟動組的結果情況;
並行業務組停止流程,包括如下幾步:
步驟1:管理節點接收到了停止並行組的命令,根據用戶生成的配置文件尋找需要停止並行組的伺服器;
步驟2:管理節點組合消息# deSt=all#rd=…,通知目的伺服器停止並行組;
步驟3:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上停止並行組,並且把並行組啟動的結果返回給管理節點;
步驟4:管理節點接收到每個目的伺服器的停止結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值;
步驟5:管理節點告知用戶停止組的結果情況;
管理節點設置並行組狀態的流程步驟如下:
步驟1:管理節點接收到並行組狀態變化的消息時,開始啟動設置組狀態流程;
步驟2:獲取消息中組的名稱以及哪個伺服器上的組狀態進行了變化;·步驟3:獲取該伺服器上對應的組狀態和需要更新的狀態是否一致;一致的話直接退出,不一致時對狀態位進行異或計算,設置新的狀態;
步驟4:完成設置保存組的最新狀態;
並行組異常時管理節點處理異常的流程步驟如下:
步驟1:運行了並行組的伺服器發現並行組發生了異常,形成消息把異常發送給管理節點;
步驟2:管理節點接收到異常報告,通過實例3設置組的狀態;
步驟3:管理節點尋找是否有依賴於並行組的業務組運行在異常伺服器上;
步驟4:假如沒有處理完成,不然遍歷尋找出所有符合步驟3條件的業務組;
步驟5:管理節點發送消息通知異常節點停止依賴與並行組的業務組;
步驟6:異常節點停止步驟5上的業務組,然後返回結果給管理節點;
步驟7:管理節點接收到步驟6的返回結果,尋找一個新的正常運行著並行組的伺服器啟動步驟4中找到的組;
步驟8:正常節點啟動業務組,並返回結果;
步驟9:管理節點設置業務組的狀態,並結束動作。
[0006]本發明不但擴大了高可用集群的應用環境,同時可以提高高可用集群服務的異常處理速度,對於一些底層的支持上層業務的組,如若不會發生衝突,可以作為並行組存在, 當上層業務出現異常時,只需要對上層業務進行處理,縮短了異常轉接的速度,更高的保證服務的連續性。[0007]本發明的有益效果是:本發明完整實現了集群中並行業務組的控制和管理,這種方法與傳統的集群組管理方法相比,可以擴大集群高可用服務的適用範圍,並且提高業務的可靠性和連續性。提高了軟體的價值。
【專利附圖】
【附圖說明】
[0008]圖1是實施例1中高可用集群系統的並行組啟動流程示意圖;
圖2是實施例2中高可用集群系統的並行組停止流程示意圖;
圖3是實施例3中並行組狀態設置流程示意圖;
圖4是實施例4中並行組異常處理流程示意圖。
【具體實施方式】
[0009]參照說明書附圖對本發明的方法作以下詳細地說明。
[0010]本發明所要解決的技術問題是,提供一種並行業務組的控制和管理方法,能夠解決集群中存在並行業務組時,對業務組進行正確的控制和管理。首先,能控制並行組的同時啟動和停止;其次,正確的記錄業務組在各個節點上的狀態;再次,在業務組在某個節點上異常時能夠進行異常操作。
[0011]一種並行業務組的控制和管理方法:集群中的某個節點作為普通的業務節點的同時還作為管理節點存在,在並行業務組啟動或者停止時,集群的管理節點根據用戶配置信息,把啟動或者停止組的命令發送到指定的伺服器上,通知需要啟動業務組的伺服器啟動或者停止該業務組;集群的管理節點會收集每個伺服器上業務組的狀態,通過組的狀態的標誌位分別記錄各個狀態;在並行業務組在某個伺服器上異常時,管理節點會觸發該服務上依賴並行業務組的其他業務組進行切換,保證對應的依賴業務組的正常提供服務。
[0012]下面結合附圖和實施例對本發明作進一步闡述。
[0013]實施例1如圖1所示
實施例1是集群中,並行業務組啟動流程,該流程主要包括如下幾步:
步驟1:用戶根據業務需求創建集群並創建一個並行業務組,完成後上傳配置文件到各個節點上,啟動集群服務。集群在啟動過程中會有一個最優的節點決策成管理節點;步驟2:管理節點接收到了啟動並行組的命令,根據用戶生成的配置文件尋找需要啟動並行組的伺服器;
步驟3:管理節點組合消息# deSt=all#rd=...,其中rd表示將要啟動並行組的伺服器的組合,然後把消息發送給所有的節點,通知目的伺服器啟動並行組;
步驟4:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上啟動並行組,並且把並行組啟動的結果返回給管理節點;
步驟5:管理節點接收到每個目的伺服器的啟動結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值;
步驟6:管理節點告知用戶啟動組的結果情況。
[0014]實施例2如圖2所示
實施例2是集群中,並行業務組停止流程,該流程主要包括如下幾步: 步驟1:管理節點接收到了停止並行組的命令,根據用戶生成的配置文件尋找需要停止並行組的伺服器;
步驟2:管理節點組合消息# dest=all#rd=...,通知目的伺服器停止並行組;
步驟3:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上停止並行組,並且把並行組啟動的結果返回給管理節點;
步驟4:管理節點接收到每個目的伺服器的停止結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值;
步驟5:管理節點告知用戶停止組的結果情況。
[0015]實施例3如圖3所示
實施例3是管理節點設置並行組狀態的流程,下面對該流程各個步驟進行詳細描述。
[0016]步驟1:管理節點接收到並行組狀態變化的消息時,開始啟動設置組狀態流程; 步驟2:獲取消息中組的名稱以及哪個伺服器上的組狀態進行了變化;
步驟3:獲取該伺服器上對應的組狀態和需要更新的狀態是否一致;一致的話直接退出,不一致時對狀態位進行異或計算,設置新的狀態;
步驟4:完成設置保存組的最新狀態。
[0017]實施例4如圖4所示
實施例4是某個節點上的並行組異常時管理節點如何處理異常的流程,該流程主要包括以下幾步。
[0018]步驟1:運行了並行組的伺服器發現並行組發生了異常,形成消息把異常發送給管理節點;
步驟2:管理節點接收到異常報告,通過實例3設置組的狀態;
步驟3:管理節點尋找是否有依賴於並行組的業務組運行在異常伺服器上;
步驟4:假如沒有處理完成,不然遍歷尋找出所有符合步驟3條件的業務組;
步驟5:管理節點發送消息通知異常節點停止依賴與並行組的業務組;
步驟6:異常節點停止步驟5上的業務組,然後返回結果給管理節點;
步驟7:管理節點接收到步驟6的返回結果,尋找一個新的正常運行著並行組的伺服器啟動步驟4中找到的組;
步驟8:正常節點啟動業務組,並返回結果;
步驟9:管理節點設置業務組的狀態,並結束動作。
[0019]至此,已經完整實現了集群中並行業務組的控制和管理,這種方法與傳統的集群組管理方法相比,可以擴大集群高可用服務的適用範圍,並且提高業務的可靠性和連續性。提高了軟體的價值。
[0020]除說明書所述的技術特徵外,均為本專業技術人員的已知技術。
【權利要求】
1.一種集群的並行業務組控制和管理的方法,其特徵在於包括集群中存在並行業務組時對業務組進行正確的控制和管理,首先,能控制並行組的同時啟動和停止;其次,正確的記錄業務組在各個節點上的狀態;再次,在業務組在某個節點上異常時能夠進行異常操作,集群中的某個節點作為普通的業務節點的同時還作為管理節點存在,在並行業務組啟動或者停止時,集群的管理節點根據用戶配置信息,把啟動或者停止組的命令發送到指定的伺服器上,通知需要啟動業務組的伺服器啟動或者停止該業務組;集群的管理節點會收集每個伺服器上業務組的狀態,通過組的狀態的標誌位分別記錄各個狀態;在並行業務組在某個伺服器上異常時,管理節點會觸發該服務上依賴並行業務組的其他業務組進行切換,保證對應的依賴業務組的正常提供服務;控制並行組的同時啟動和停止,其中:並行業務組啟動流程包括如下幾步:步驟1:用戶根據業務需求創建集群並創建一個並行業務組,完成後上傳配置文件到各個節點上,啟動集群服務,集群在啟動過程中會有一個最優的節點決策成管理節點;步驟2:管理節點接收到了啟動並行組的命令,根據用戶生成的配置文件尋找需要啟動並行組的伺服器;步驟3:管理節點組合消息# deSt=all#rd=…,其中rd表示將要啟動並行組的伺服器的組合,然後把消息發送給所有的節點,通知目的伺服器啟動並行組;步驟4:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上啟動並行組,並且把並行組啟動的結果返回給管理節點;步驟5:管理節點接收到每個目的伺服器的啟動結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值; 步驟6:管理節點告知用戶啟動組的結果情況;並行業務組停止流程,包括如下幾步:步驟1:管理節點接收到了停止並行組的命令,根據用戶生成的配置文件尋找需要停止並行組的伺服器;步驟2:管理節點組合消息# deSt=all#rd=…,通知目的伺服器停止並行組;步驟3:各節點收到消息後,解析rd的伺服器中是否有本節點,如果沒有直接不發生動作;假如本節點在目的伺服器中時,節點馬上停止並行組,並且把並行組啟動的結果返回給管理節點;步驟4:管理節點接收到每個目的伺服器的停止結果返回值,根據成功或者失敗設置伺服器在組的狀態位上的值;步驟5:管理節點告知用戶停止組的結果情況;管理節點設置並行組狀態的流程步驟如下:步驟1:管理節點接收到並行組狀態變化的消息時,開始啟動設置組狀態流程;步驟2:獲取消息中組的名稱以及哪個伺服器上的組狀態進行了變化;步驟3:獲取該伺服器上對應的組狀態和需要更新的狀態是否一致;一致的話直接退出,不一致時對狀態位進行異或計算,設置新的狀態;步驟4:完成設置保存組的最新狀態;並行組異常時管理節點處理異常的流程步驟如下:步驟1:運行了並行組的伺服器發現並行組發生了異常,形成消息把異常發送給管理節點;步驟2:管理節點接收到異常報告,通過實例3設置組的狀態;步驟3:管理節點尋找是否有依賴於並行組的業務組運行在異常伺服器上;步驟4:假如沒有處理完成,不然遍歷尋找出所有符合步驟3條件的業務組;步驟5:管理節點發送消息通知異常節點停止依賴與並行組的業務組;步驟6:異常節點停止步驟5上的業務組,然後返回結果給管理節點; 步驟7:管理節點接收到步驟6的返回結果,尋找一個新的正常運行著並行組的伺服器啟動步驟4中找到的組;步驟8:正常節點啟動業務組,並返回結果;步驟9:管理節點設置業務組的狀態,並結束動作。
【文檔編號】H04L29/08GK103595771SQ201310530438
【公開日】2014年2月19日 申請日期:2013年11月1日 優先權日:2013年11月1日
【發明者】王婷 申請人:浪潮電子信息產業股份有限公司