新四季網

遊龍科技解讀金融企業伺服器集群運維

2024-12-29 08:11:08

    伺服器運行狀態的收集和分析工作,對於業務平臺的穩定來說至關重要,這也是伺服器管理中最基本的組成部分。而如今在各行業中都廣為出現的伺服器集群(Server Cluster),從客戶端來看,它們是隱型的,而在管理員眼中則需分而治之。當群集中的伺服器數量越來越多的時候,運維人員應該如何具體地進行監控和管理呢?遊龍科技(SiteView)作為國內領先的IT運維廠商,在大量金融行業成功案例經驗的基礎上,對於伺服器集群的監控和管理提出了嶄新的觀點。

伺服器集群(Clusters)的「亞健康」

    伺服器集群提供了先進的容錯能力和模塊化的系統擴展能力,一旦某個系統出現故障,應用服務將被重新啟動或被另一臺伺服器接管,這正符合了金融行業客戶的廣泛需求。網上業務量的大量增長,使得伺服器集群在這類企業中的應用大量出現。作為高可用性和穩定性的代表,本是無可挑剔的,但仍有一些企業在牽動這些「大象」時,卻依然在使用過時的技術。舉例來說,一個伺服器集群的運行狀況,一般就代表一個核心業務系統的可用與否的關鍵因素,傳統監控方法僅僅簡單地認為集群中的某臺主機無非是「可用」或「不可用」兩種狀態。

    遊龍科技認為:「正是因為管理人員對於集群系統的過分信任,才會導致判斷它時採用這樣簡單的做法,但這隻考慮了兩種極端的狀態,顯然無法對集群系統的健康狀況進行全面分析」。在農業發展銀行、上海交通銀行、新華期貨、金石期貨、江海證券、中海基金……等國內大量遊龍科技客戶的實際應用中,我們對各種伺服器應用集群進行了監控,大量的情況證明系統從「可用」轉向「不可用」並非是瞬間發生,而是一個相當繁瑣的過程。在這個過程中,系統的某些核心指標將會提前顯示出異常,雖然此時系統的對外表現仍然為「可用」,但整個系統實際已經處於「亞健康」,對客戶端的請求反應逐漸變慢,系統出現不穩定的跡象,系統整體可用性逐漸降低。如果不進行任何幹預,系統在未來某個時點將有極大可能轉化為真正「不可用」,從而導致災難性的後果。

伺服器集群(Clusters)運維「三步走」

    集群中每臺伺服器都應該得到同樣的關注,而如何整體監控到整個集群的好壞呢?遊龍科技認為可以採用這樣的步驟:「先做到監控單臺伺服器的性能,然後根據業務進行分組,最後針對集群整體性能實時監控」。

    第一步:全面掌控集群運行的基本信息。在沒有有效工具幫助的情況下,伺服器集群的維護工作異常繁重,同時也直接影響了運行的效果。管理人員首先可以利用SiteView ECC實時全面的信息收集,先對伺服器靜態指標(如:作業系統類型、版本、CPU型號、CPU個數、物理內存和交換空間的大小等)收集上來。然後將動態指標(如:系統連續運行時間、CUP、內存、磁碟分區使用率、某一進程佔用的系統資源、某一進程在系統中的數目等)在管理平臺上設置儀錶盤或者直方圖顯示,做好最基本的監控管理。

    第二步:根據業務狀況將集群進行對應分組。可通過SiteView ECC的分組功能將伺服器、存儲和網絡設備針對業務進行分組。分組功能相當重要,原因在於,20年前,一個典型的銀行僅提供3-5種業務,但現在,主要業務就達幾十乃至上百種。這包括:抵押貸款、個人貸款、儲蓄,以及信用卡帳戶和內部協同管理伺服器群等等,如果不分組的話,在管理員眼裡這些系統還都是單獨的,這也就失去了整體運維的作用。管理員利用分組功能之後,就可使用SiteView ECC內置的幾十種監測器,通過對業務服務主機進行定時和實時的監測,提供其需要的業務服務水平數據,包括業務系統所經路徑的延遲、丟包、流量、網絡停頓時間和網絡可用率等更詳細數據的管理。

    第三步:全面預警,深化調優。管理員可通過SiteView ECC可定製的監測器功能對集群性能整體進行監管。例如:反映集群服務的總體運行狀況,集中顯示特定方面的數據;反映伺服器運行狀況和性能的基礎結構數據;反映心跳線中數據檢測的正常工作;反映可能出現伺服器切換的響應時間;反映特定用戶體驗的客戶端數據,例如連接集群時間、連接成功比率的特定操作等等。並根據指定的邏輯與設定閾值進行比較,如果滿足該邏輯,則進行報警。報警方式可選擇郵件或者手機簡訊息。並且還可以將採集來的數據存入SiteView ECC資料庫,作為數據挖掘,集群性能分析的數據源。

    遊龍科技針對伺服器集群的運維方向的研究已經被眾多的金融企業所應用。以上海交通銀行為例,SiteView ECC被安裝在核心伺服器上,能夠對上海交行的上千臺伺服器進行統一的監測,通過一個界面能夠看到整個伺服器集群的運行狀況,全面掌握伺服器區的運行,這樣就可不用部署複雜繁多的設備來監控大規模的伺服器集群。與上海交行的感觸相同,很多金融企業中的運維人員紛紛表示:「我們的系統必須能夠每天 24 小時、每周 7天不間斷地工作。此外,我們還需要簡化數據中心,以便快速部署系統來應對需求波動,SiteView ECC強大的功能讓我們感到驚訝。對於那些正在尋找關鍵任務數據中心運維解決方案的人來說,也可以方便地滿足用戶自己的配置定義和功能擴充要求。」
                

同类文章

創新才能共贏酷6網UGC模式為你引航

    YouTube是世界上最大的視頻分享網站,以UGC(用戶產生內容)視頻互動分享為主,而對於這種UGC視頻平臺建設而言,用戶與內容量是發揮規模效應的基礎。作為短視頻網站的代表,酷6網一直堅持著UGC路線,他所擁有的海量視頻資源以及優秀拍客群體,都為它在短視頻領域的成功奠定了基礎,使它成為目前中

「短酷」APP成為拜年「潮品」

        春節期間,一款名為「短酷」的APP悄然躥紅。一年一度的新春佳節是中國老百姓歡聚一堂、享受人生的日子,大家在一起留影紀念必不可少。「短酷」能夠將照片一鍵變成短視頻,還可以配樂、配上自己想說的話,順應了過年期間記錄美好回憶的需求。也有些不能回家團圓的朋友用「短酷」為家人做一封「電子家書

聯建光電攜手微信紅包 史上最大紅包有望出爐

    【2014年2月13日,深圳】在2014年元宵節和情人節「雙節」臨近之際,中國企業家思想群友(微信公眾號,CEOideas )攜手創業板上市公司聯建光電(股票代碼,300269),開展微信搶紅包創意活動。本次活動是繼2014年農曆微信搶紅包後又一次具有實驗意義的傳播活動,將掀起微信搶紅包的又

搜狗壁紙:甜蜜浪漫過雙節

    今年的2月14日正好就是農曆正月十五,元宵節和情人節趕在了同一天。還沒從春節的喜悅中緩過神來的朋友們,又將迎來一個特別浪漫的節日。為此,搜狗壁紙為廣大用戶準備了眾多精美的元宵節及情人節壁紙,為大家增添節日氣氛。   元宵節 鬧元宵  農曆正月十五元宵節,又稱為「上元節」,是中國漢族和部分兄弟

騰訊QQ上線3D大黃臉表情包:目前已有16種

       說到QQ大黃臉表情,大家一定都非常熟悉,而根據相關的統計數據,其中「笑哭」的表情也是中國網遊使用頻率最高的表情。近日,騰訊QQ再次推出了3D版的QQ黃臉表情,共16個表情包,讓人看了忍不住像要下載。      據了解,這一套看起來超萌的表情包卻耗費了設計師不少的精力,尤其是那個經典的「
你們不是水軍!?仙劍6發行商認錯道歉

你們不是水軍!?仙劍6發行商認錯道歉

    《仙劍奇俠傳6》引發的爭議又進入了新階段了——玩家的吐槽還在繼續,周六官方火上澆油式的公關招到了更多人的反感,但居高臨下指責水軍抹黑的仙劍6發行商暢遊樂動已經頂不住了,昨晚刪除了之前的微博,已經向玩家表示歉意。    事情的起因不需多說了,玩仙劍6的肯定知道,不玩的人估計也不會關心。其實大家
繼續打巨魔的節奏 魔獸7.0新內容曝光

繼續打巨魔的節奏 魔獸7.0新內容曝光

    這是一篇美服論壇的劇透帖子——這樣的帖子每天發10個都不會累,但是這一個不同:次的LZ似乎就是上次在MMO champion上爆料WOD的那個啊!    要不就是暴雪沒學乖,要不就是暴雪故意的,不過由於WOD這種營銷看起來還挺成功,故意的可能性也許大?    資料片內容預覽      資料片
《爐石傳說》"冠軍的試煉"八月開啟

《爐石傳說》"冠軍的試煉"八月開啟

    在地精與侏儒交戰8個多月之後,《爐石傳說》的新內容「冠軍的試練」即將在8月初正式登場,屆時將有132張全新的卡牌、全新主題的對戰面板以及歡迎各位買買買的新卡包來到各位玩家面前,下面我們就一起來了解一下《爐石傳說》「冠軍的試練」中的內容吧。以下內容來自爐石傳說官網    來自艾澤拉斯各個角落的
不再掉幀?《仙劍奇俠傳6》新補丁到來

不再掉幀?《仙劍奇俠傳6》新補丁到來

《仙劍奇俠傳6》PC版的優化讓很多玩家揪心,在遊戲發售後,《仙劍奇俠傳6》官方面對玩家提出的各種問題積極回應反饋,補丁也在緊急製作中,今日,《仙劍奇俠傳6》的1.0.3補丁正式發布,一起來看看都更新了哪些玩家迫切等待修復的問題吧。    針對之前《仙劍奇俠傳6》版本的3D效能優化效果不流暢,或者運行
《虛空之遺》開啟預購 快來買買買!

《虛空之遺》開啟預購 快來買買買!

    作為暴雪旗下《星際爭霸II》三部曲的最終篇章——《星際爭霸II:虛空之遺》於今日正式開啟了預售,現在各位玩家可以通過點擊「」或打開自己的戰網客戶端進入到《星際爭霸II:虛空之遺》國服的預購頁面,提前入手《星際爭霸II:虛空之遺》。    在這次《星際爭霸II:虛空之遺》國服的預售活動中,各位