基於樹回歸的虛擬化雲平臺能耗測量方法及系統的製作方法
2023-10-08 22:58:44 1
基於樹回歸的虛擬化雲平臺能耗測量方法及系統的製作方法
【專利摘要】本發明提供了一種基於樹回歸的虛擬化雲平臺能耗測量方法及系統,該方法包括如下步驟:信息採集步驟,物理機周期性地將採集到的信息發送給指定的控制節點,採集的信息包括物理機和虛擬機的資源信息、以及從測量計得到的能耗信息;參數訓練步驟,由控制節點負責使用樹回歸算法將數據集分段進行線性擬合,得到每個子集合中資源能耗模型參數α、γ;能耗計算步驟,控制節點根據擬合的參數和虛擬機信息進行計算,得到虛擬機的能耗。本發明的有益效果是:本發明採用基於回歸樹的方法對不同資源的使用率分段建立線性模型,改進了傳統單一線性模型的準確度不夠高的缺點;回歸樹模型計算簡單、高效,對實時性的能耗模型參數更新體現為效率更高。
【專利說明】基於樹回歸的虛擬化雲平臺能耗測量方法及系統
【技術領域】
[0001] 本發明涉及數據處理領域,尤其涉及基於樹回歸的虛擬化雲平臺能耗測量方法及 系統。
【背景技術】
[0002] 當前雲計算迅速發展,各企業紛紛投入大量資金建起自己的數據中心。因此,能耗 的細粒度監控和管理是當前急需解決的主要技術問題。傳統的數據中心採用電錶方式對 各種設備的能耗進行監控,但仍然有諸多的數據中心調度策略依賴於實時獲取伺服器的能 耗、其上運行的應用、以及虛擬機的能耗信息。尤其是對於虛擬化雲平臺的伺服器能耗、其 上運行的軟體能耗、以及其上運行的虛擬機能耗,以軟體方式實時獲取對於構建未來數據 中心的調度、節能、計費具有重要意義。已有技術如下:
[0003] (1)物理機的能耗採用了電錶或者伺服器內置電錶來測量物理機能耗。
[0004] (2)對運行不同虛擬機的系統內部分別採集虛擬機內部的資源信息,利用各個虛 擬機的幾種資源總和與伺服器電錶值進行建模,特點是虛擬機內部安插一定的代理程序。 獲取相關數據進行建模,對於複雜多機情況沒有考慮。
[0005] Eg:北京郵電大學提出了一種基於虛擬機內部資源監控的虛擬機能耗測量方法, 不足之處是虛擬機內部顯示的資源信息並不準確反映了虛擬機的真實物理資源使用情況, 對於異構的虛擬機運行不同的程序來說就相對不實用,而且準確度也不夠高。
[0006] (3)結合虛擬化底層的hypervisor,監控物理資源,包括CPU,內存,Disk,網絡1/ 〇情況,以及每個虛擬機在使用物理資源時候的一些特徵信息的採集,結合能耗信息進行建 模。首先建模,物理機資源和能耗的關係,然後通過獲取各個虛擬機使用的各種物理資源情 況來進行能效計算轉換,難點在於提取物理硬體上的各個虛擬機分別執行的特徵信息。
[0007] Eg :微軟,中國電信,IBM等公司發表的專利採取了基於事件和基於資源對虛擬機 劃分的方式進行能耗分配計算模型評估虛擬機能耗,但仍然存在針對不同的場景下的模型 效果誤差大的情況,因此需要一種優化技術來對目前的單一模型採取自適應的方法以及對 結果進行優化的解決方案從而提高虛擬機能耗評估的準確度。
[0008] (4)國外發表的相關論文在關於能耗測量技術方面採用了諸多的模型,其中典型 的有線性模型、多項式模型、支持向量回歸的方法。
[0009] 專利列表如下:
[0010]
【權利要求】
1. 一種基於樹回歸的虛擬化雲平臺能耗測量方法,其特徵在於,包括如下步驟: 信息採集步驟,物理機周期性地將採集到的信息發送給指定的控制節點,採集的信息 包括物理機和虛擬機的資源信息、以及從測量計得到的能耗信息; 參數訓練步驟,由控制節點負責使用樹回歸算法將數據集分段進行線性擬合,得到每 個子集合中資源能耗模型參數a、Y ; 能耗計算步驟,控制節點根據擬合的參數和虛擬機信息進行計算,得到虛擬機的能耗, 並評估物理機能耗準確率。
2. 根據權利要求1所述的虛擬化雲平臺能耗測量方法,其特徵在於,該虛擬化雲平臺 能耗測量方法還包括: 測量系統的基礎功率步驟,當物理機處於空閒狀態時,周期性地採集測量計的功率值, 求得一段時間內的平均值作為基礎功率。
3. 根據權利要求2所述的虛擬化雲平臺能耗測量方法,其特徵在於,在所述信息採集 步驟中,通過在物理機內部署採集程序的黑盒方法,採集物理機和虛擬機的資源信息以及 功率值。
4. 根據權利要求3所述的虛擬化雲平臺能耗測量方法,其特徵在於,在所述參數 訓練步驟中,將採集到的功率值和物理機的資源特徵信息組成訓練數據集D,集合D = {dl, d2,. . .,dn},某個記錄di為m元組(f 1,f2, f3, Psys),其中前f 1?fn-1代表資源事件 相關信息,Psys是m元組最後一個元素。
5. 根據權利要求4所述的虛擬化雲平臺能耗測量方法,其特徵在於,在所述參數訓 練步驟中,在集合中選擇最優分割點,以此將數據集分割為兩個子集,並在子集上遞歸完 成樹的構建;函數SplitData根據最優分割點切分數據集,如將集合中對應feature部件 的資源特徵信息值小於分割點中value的劃分為子集leftdata,大於等於的記錄劃分為 rightdata〇
6. 根據權利要求5所述的虛擬化雲平臺能耗測量方法,其特徵在於,在函數 SelectFeat中引入閥值s,當子集分割到樣本數目小於閾值s時,則停止劃分,作為葉節點 處理;SelectFeat計算最優分割點的方法是遍歷集合中所有屬性的取值,尋找能帶來最小 的錯誤率的點。
7. 根據權利要求6所述的虛擬化雲平臺能耗測量方法,其特徵在於,在數據集合可逆 的情況下進行線性擬合,從而得到該集合下的資源能耗模型參數;若是數據結合不可逆,則 採用模型樹的方法,用集合內功率的平均值作為預測值。
8. 根據權利要求7所述的虛擬化雲平臺能耗測量方法,其特徵在於,樹模型將數據集 合D根據分割點集合B,劃分為子集合;在葉節點的子集合中,通過模型樹或回歸樹進行預 測,回歸樹根據線性擬合方法得到模型參數,模型樹返回某個預測值。
9. 根據權利要求8所述的虛擬化雲平臺能耗測量方法,其特徵在於,在所述能耗計算 步驟中,虛擬機資源信息集合D,D中每個記錄為(fvl, fv2, fv3),分別表示某時刻某虛擬機 的CPU、內存和磁碟的資源信息,遍歷樹模型找到對應的葉節點,計算出各個部件功率,並得 到虛擬機在該時刻的功率。
10. -種基於樹回歸的虛擬化雲平臺能耗測量系統,其特徵在於,包括多個物理機、多 個虛擬機、多個能耗測量計、多個控制節點、以及web伺服器,在物理機上通過虛擬化層管 理虛擬機,物理機內採用黑盒方法採集資源特徵信息,通過能耗測量計周期性測量物理機 的瞬時功率;控制節點負責數據存儲和處理,包括資源能耗模型參數訓練,物理機能耗測量 準確度和各個虛擬機某段時間的能耗信息;樹回歸算法在控制節點中運行,用來進行資源 能耗模型參數訓練;物理機和虛擬機的能耗結果通過訪問Web伺服器查看。
【文檔編號】G06F1/28GK104407688SQ201410592305
【公開日】2015年3月11日 申請日期:2014年10月29日 優先權日:2014年10月29日
【發明者】黃荷姣, 顧崇林, 史鵬宙, 石帥 申請人:哈爾濱工業大學深圳研究生院