一種用於SASSwitch整機櫃監聽節點SOL的系統及方法與流程
2023-07-01 15:44:51 2

本發明涉及伺服器技術,具體涉及SAS Switch整機櫃監聽節點SOL的系統及方法。
背景技術:
伺服器產品在當今諸多領域得到了廣泛的應用,如金融保險、軍工國防、教育科技、生產製造,以及消費電子、數據中心等,隨著伺服器產品應用範圍的不斷擴大,給實際運行的伺服器數量帶來了指數型的增長,特別是在伺服器集群部署等應用場景對伺服器數量的需求更是驚人。
傳統的通用伺服器規模化應用帶來密度低、能耗高、安裝和維護工作量大等問題,一種面向大型數據中心計算的伺服器應運而生——整機櫃伺服器。
SAS Switch整機櫃中計算節點較多,在測試過程中,計算節點容易出現各種各樣的bug,對計算節點的串口SOL進行監聽就顯得很有必要。
通常情況下,一旦計算節點出現宕機故障,此時無法鍵入相關命令來收集相關信息,因此在測試過程中後臺執行一些監聽程序,以獲取SAS Switch整機櫃計算節點的運行信息,針對SAS Switch整機櫃中大量的計算節點的串口SOL,提供更加高效、不間斷對SAS Switch計算節點串口SOL狀態進行長時間監聽就成了亟需解決的問題。
技術實現要素:
為解決上述技術問題,本發明的技術方案如下:
本發明提供一種用於SAS Switch整機櫃監聽節點SOL的方法,包括如下步驟:
SS1、準備測試環境;
SS2、將整機櫃計算節點對應的BMC IP位址導入到腳本程序中;
SS3、在控制端通過IPMI命令遠程訪問計算節點BMC,並執行相關操作,相關操作包括:關閉該節點串口重定向,打開串口重定向。
進一步的,步驟SS3包括:
SS31、關閉所有計算節點的串口重定向;
SS32、創建文件來構建命名管道,通過excel函數來進行重定向並綁定相關的文件描述符;
SS33、打開所有計算節點的串口重定向;
SS34、後臺不間斷抓取列印的串口重定向信息。
進一步的,步驟SS1的準備測試環境具體為:使用SAS Switch整機櫃的某個計算節點作為測試控制節點,並配置好各個節點之間的無密碼訪問,保證各個節點相互之間能夠ping通。
進一步的,另外選取一臺伺服器節點作為測試控制節點。
進一步的,通過以下命令遠程登錄節點BMC並關閉串口重定向:ipmitool-I lanplus-H $ip-U ADMIN-P ADMIN sol deactivate。
進一步的,通過以下命令來創建文件來構建命名管道,通過excel函數來進行重定向並綁定相關的文件描述符:
tempfifo=$$.fifo
mkfifo $tempfifo
exec 1000$tempfifo。
進一步的,通過以下命令來實現後臺不間斷的打開節點BMC的串口重定向並將列印內容輸出:nohup ipmitool-I lanplus-H $ip-U ADMIN-P ADMIN sol activate>>$ip.log 2>&1<&1000&。
此外本發明提供一種用於SAS Switch整機櫃監聽節點SOL的系統,包括SAS Switch各個計算節點BMC、測試控制節點、網卡1、遠程管理伺服器、網卡2和存儲器,SAS Switch各個計算節點BMC與測試控制節點通過網卡1連接,測試控制節點與遠程管理伺服器通過網卡2連接,存儲器與測試控制節點連接,SAS Switch各個計算節點BMC用於獲取串口信息,測試控制節點用於保存SAS Switch各個計算節點BMC發送的串口信息,在伺服器死機時,用戶可以在遠程管理伺服器通過智能平臺管理接口IPMI的ipmi命令通過串口重定向SOL接口功能獲取到保存在存儲器中的串口信息。
進一步的,測試控制節點為SAS Switch整機櫃的某個計算節點或另外選取一臺伺服器節點作為測試控制節點。
進一步的,存儲器採用堆棧的方式存儲串口信息,存儲器為測試控制節點內置的高速緩衝存儲器Cache或隨機存取存儲器RAM。
本發明的方案是一種更加高效、不間斷對SAS Switch計算節點串口SOL狀態進行長時間監聽的方法。此方法對SAS Switch整機櫃的計算節點的工作監控提供了便捷,簡單實用。
附圖說明
圖1示出本發明用於SAS Switch整機櫃監聽節點SOL的方法流程圖。
圖2示出本發明用於SAS Switch整機櫃監聽節點SOL的系統結構框圖。
具體實施方式
以下結合說明書附圖及具體實施例進一步說明本發明的技術方案。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,並不用於限定本發明。
本發明提供一種更加高效、不間斷對SAS Switch計算節點串口SOL狀態進行長時間監聽的方法,步驟如下:
SS1、準備測試環境;
SS2、將整機櫃計算節點對應的BMC IP位址導入到腳本程序中;
SS3、在控制端通過IPMI命令遠程訪問計算節點BMC,並執行相關操作,相關操作包括:關閉該節點串口重定向,打開串口重定向。
其中步驟3具體包括以下步驟:
SS31、關閉所有計算節點的串口重定向;
SS32、創建文件來構建命名管道,通過excel函數來進行重定向並綁定相關的文件描述符;
SS33、打開所有計算節點的串口重定向;
SS34、後臺不間斷抓取列印的串口重定向信息。
其具體實現過程為:
使用SAS Switch整機櫃的某個計算節點或另外選取一臺伺服器節點作為測試控制節點,並配置好各個節點之間的無密碼訪問,保證各個節點相互之間能夠ping通,需要將SAS Switch計算節點的BMC IP寫入腳本程序中的bmciplist中。
利用IPMI命令先關閉各個計算節點的串口重定向,之後構建文件創建命名管道,並通過exec函數綁定自定義的文件描述符;
利用IPMI命令打開各個計算節點的串口重定向,並不間斷的列印串口信息。
具體Server端執行的相關腳本sol_minitor.sh主要為以下內容:
bmciplist="
192.168.1.120
192.168.1.121
192.168.1.122
192.168.1.123
192.168.1.124
192.168.1.125
192.168.1.126
192.168.1.127
192.168.1.128…
"//將整機櫃中每個節點的BMC ip地址寫入變量bmciplist中//
for ip in $bmciplist;do
echo $ip//列印調用的IP位址//
ipmitool-I lanplus-H $ip-U ADMIN-P ADMIN sol deactivate
done//遠程登錄節點BMC並關閉串口重定向
tempfifo=$$.fifo//將創建的當前進程PID的fifo文件賦給tempfifo//
mkfifo $tempfifo//利用創建的fifo文件創建命名管道//
exec 1000$tempfifo//打開創建的fifo文件可讀寫操作,與自定義文件描述符fd1000綁定//
rm-rf $tempfifo//刪除已創建的fifo文件//
for ip in $bmciplist;do
echo $ip//列印調用的IP位址//
nohup ipmitool-I lanplus-H $ip-U ADMIN-P ADMIN sol activate>>$ip.log 2>&1<&1000&//後臺不間斷的打開節點BMC的串口重定向並將列印內容輸出//
done程序結束。
下面參考說明書附圖2描述根據本發明用於SAS Switch整機櫃監聽節點SOL的系統。
圖2為本發明一個實施例的用於SAS Switch整機櫃監聽節點SOL的系統的結構框圖。
如圖2所示,根據本發明實施例的用於SAS Switch整機櫃監聽節點SOL的系統,包括SAS Switch各個計算節點BMC、測試控制節點、網卡1、遠程管理伺服器、網卡2和存儲器。
其中,SAS Switch各個計算節點BMC設置在SAS Switch整機櫃伺服器之上,SAS Switch各個計算節點BMC為安裝在伺服器主板上的獨立的板卡,不依賴於伺服器的處理器、BIOS或作業系統而可以獨立進行工作。SAS Switch各個計算節點BMC與測試控制節點通過網卡1相連,整機櫃內SAS Switch各個計算節點BMC IP與測試控制節點IP能互相ping通,即SAS Switch計算節點BMC IP與測試控制節點要在同一個網段。
測試控制節點為SAS Switch整機櫃的某個計算節點或另外選取一臺伺服器節點作為測試控制節點。
具體地,SAS Switch各個計算節點BMC用於獲取串口信息,由於SAS Switch各個計算節點BMC為安裝在伺服器主板上的獨立的板卡,當伺服器發生故障時,SAS Switch各個計算節點BMC可以及時獲取到伺服器故障發生時的信息,並通過IPMI的串口重定向SOL接口功能將獲取到的信息通過網卡1發送至測試控制節點,其中串口重定向SOL接口功能是指在標準的網絡連接上模擬串口通訊,同時通過串口重定向SOL接口功能也可以將獲取到的信息保存起來。
測試控制節點與遠程管理伺服器通過網卡2相連。
測試控制節點用於保存SAS Switch各個計算節點BMC發送的串口信息,並在伺服器死機時,通過智能平臺管理接口IPMI查詢存儲器中存儲的串口信息。
在伺服器死機時,用戶可以在遠程管理伺服器通過智能平臺管理接口IPMI的ipmi命令通過串口重定向SOL接口功能獲取到保存在存儲器中的串口信息。
在本發明的一個實施例中,存儲器採用堆棧的方式存儲串口信息。使用堆棧的方式存儲信息處理快捷,效率高。
在本發明的一個實施例中,存儲器為測試控制節點內置的高速緩衝存儲器Cache或隨機存取存儲器RAM。
通過上述的方案就可以實現對節點SOL的後臺監聽,一旦節點出現某種比較嚴重的bug,後臺監聽節點SOL的程序上記錄的log就會提供一些參考依據來幫助分析解決bug,這種方法特別適合計算節點較多的整機櫃,能夠實現長時間不間斷的監聽SAS Switch整機櫃中計算節點串口SOL狀態。
儘管在裝置的上下文中已描述了一些方面,但明顯的是這些方面也表示對應方法的描述,其中塊或設備與方法步驟或方法步驟的特徵相對應。類似地,在方法步驟的上下文中所描述的各方面也表示對應的塊或項目或者對應裝置的特徵的描述。可以通過(或使用)如微處理器、可編程計算機、或電子電路之類的硬體裝置來執行方法步驟中的一些或所有。可以通過此類裝置來執行最重要的方法步驟中的某一個或多個。
所述實現可以採用硬體或採用軟體或可以使用例如軟盤、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM、或快閃記憶體之類的具有被存儲在其上的電子可讀控制信號的數字存儲介質來執行,所述電子可讀控制信號與可編程計算機系統配合(或能夠與其配合)以使得執行相應的方法。可以提供具有電子可讀控制信號的數據載體,所述電子可讀控制信號能夠與可編程計算機系統配合以使得執行本文所描述的方法。
所述實現還可以採用具有程序代碼的電腦程式產品的形式,當電腦程式產品在計算機上運行時,程序代碼進行操作以執行該方法。可以在機器可讀載體上存儲程序代碼。
以上所描述的僅是說明性,並且要理解的是,本文所描述的布置和細節的修改和變化對於本領域技術人員而言將是明顯的。因此,意在僅由所附權利要求的範圍而不是由通過以上描述和解釋的方式所呈現的特定細節來限制。