基於調用數據的服務參數關係匹配方法及系統的製作方法
2023-07-17 20:04:51 1
專利名稱:基於調用數據的服務參數關係匹配方法及系統的製作方法
技術領域:
本發明涉及Web服務技術領域,尤其涉及一種基於調用數據的服務參數關係匹配 方法及系統。
背景技術:
在服務發現領域,服務匹配是指對用戶輸入的關鍵字或者概念,進行與服務註冊庫 中的服務描述信息匹配;在服務組合領域,服務匹配是指匹配服務參數之間的關係,通 過這樣的關係判斷服務能否可以組合;所以,服務匹配是服務發現與服務組合基礎環節, 其旨在得到服務參數之間或者服務參數與輸入關鍵詞之間的關係或者匹配度。
目前,Web服務匹配方法包括語法服務匹配、語義服務匹配。其中,語法服務匹配 通過服務描述(WSDL文檔)中已有的模式層信息,如服務參數名稱等,或者用戶對其 的標註進行服務匹配;然而,通過模式層信息得到的服務匹配顯然無法保證正確率,同 樣的服務參數描述可能對應著完全不同語義的參數;語法服務匹配僅僅可以尋找到服務 匹配的備選集合,進一步需要用戶通過對數據的觀察再次進行篩選,對用戶依賴性很高, 實用性很差;目前應用比較廣泛的UDDI系統屬於語法服務匹配方法。
語義服務匹配利用已經存在的服務的參數與概念之間的對應關係進行服務匹配,也 就是說利用本體論方法來解決傳統語法級服務描述的異構性,增強對主體服務的功能、 行為的語義描述;這些匹配算法通常依賴於邏輯演繹和推理,具有查準率高、匹配效率 不佳,實用性、靈活性較差等特點。目前的研究中,大多假設服務的語義信息是可以信 賴的,然而當前的服務的語義信息主要來源於本體文件(OWL),本體文件是由人工構建 的,不可避免將出現錯誤,同時用戶所處的領域不同或者命名方式不同,都可能導致服 務語義標註不統一;因此,語義服務匹配無法保證正確率,在當下更加無法真正應用。
發明內容
本發明的目的是提供一種基於調用數據的服務參數關係匹配方法及系統,以提出一 種脫離語義標註,並且能較準確地獲得服務匹配關係的系統。 為達到上述目的,本發明採用如下的技術方案基於調用數據的服務參數關係匹配方法,包括以下步驟 服務調用數據獲取步驟,獲取服務的調用數據;
服務調用數據取樣步驟,對服務調用數據粗樣本進行處理,去除噪聲信息,進行初 步的數據挖掘;
關係匹配步驟,通過取樣數據進行匹配,得到服務參數之間的關係; 匹配結果應用步驟,通過新挖掘出的服務關係更新服務發現與組合結果。 基於調用數據的服務參數關係匹配系統,包括 服務調用數據獲取模塊,用於獲取服務的調用數據;
服務調用數據取樣模塊,用於對服務調用數據粗樣本進行處理,去除噪聲信息,進
行初步的數據挖掘;
關係匹配模塊,用於通過取樣數據進行匹配,得到服務參數之間的關係; 匹配結果應用模塊,用於通過新挖掘出的服務關係更新服務發現與組合結果。 所述服務調用數據獲取模塊包括服務調用通用模塊、客戶端創建模塊、服務調用數
據存儲文件。
所述服務調用數據取樣模塊包括服務調用緩存取樣模塊、隨機取樣模塊、服務取樣 存儲庫。
所述關係匹配模塊包括數據對比模塊、特徵向量匹配模塊、文本相似度匹配模塊、 匹配結果存儲庫。
所述特徵向量匹配模塊的特徵向量信息包括通過服務調用結果抽取的數據統計信 息、服務模式層文字類統計信息、服務設計約束信息。 本發明具有以下優點和積極效果-
1) 脫離服務的語義標註得到服務參數匹配關係;
2) 隨著調用數據量的增大,準確率提高,並且可以保證準確率。
圖1是本發明基於調用數據的服務參數關係匹配方法的流程圖。
圖2是本發明基於調用數據的服務參數關係匹配系統的詳細模塊結構圖。
圖3是本發明中通過新得到的服務參數關係更新服務檢索索引的實例示意圖。
圖4是本發明中通過新得到的服務參數關係更新服務組合網絡的實例示意圖。
其中,
ll一服務調用數據獲取步驟、12—服務調用數據取樣步驟、13—關係匹配步驟、14一匹配結果應用步驟、21—服務調用數據獲取模塊、22—服務調用數據取樣模塊、23 一關係匹配模塊、24—匹配結果應用模塊、25—服務調用客戶端、26—服務調用數據。
具體實施例方式
下面以具體實施例結合附圖對本發明作進一步說明
圖1所示為構成本發明的基於調用數據的服務參數關係匹配方法的流程圖,包括
服務調用數據獲取步驟ll、服務調用數據取樣步驟12、關係匹配步驟13、匹配結果應
用步驟14,其具體的實現步驟詳細描述如下
服務調用數據獲取步驟ll,獲取服務的調用數據;
服務調用數據取樣步驟12,對服務調用數據粗樣本進行處理,去除噪聲信息,進 行初步的數據挖掘;
關係匹配步驟13,通過取樣數據進行匹配,得到服務參數之間的關係;
匹配結果應用步驟14,通過新挖掘出的服務關係更新服務發現與組合結果。
下面結合圖2進一步詳細描述本發明基於調用數據的服務參數關係匹配系統,該 系統包括服務調用數據獲取模塊21、服務調用數據取樣模塊22、關係匹配模塊23、匹 配結果應用模塊24、服務調用客戶端25、服務調用數據26,其中服務調用數據獲取模 塊21、服務調用數據取樣模塊22、關係匹配模塊23、匹配結果應用模塊24構成了系 統運行端,服務調用客戶端25、服務調用數據26構成了服務調用端。
服務調用數據獲取模塊21用於獲取服務的調用數據,其數據獲取來源主要包括客 戶端與系統運行端。服務調用數據獲取模塊21包括服務調用通用子模塊、客戶端創建 子模塊,以及服務調用數據存儲文件。服務調用客戶端25調用服務調用數據26,並將 數據輸送至服務調用數據獲取模塊21 。
客戶端創建子模塊,由系統通過服務信息生成對服務進行調用的代碼,即客戶端, 用戶下載客戶端後進行編譯運行,實現對服務的調用。在客戶端的服務調用中,系統創 建內嵌服務調用數據獲取代碼的客戶端提供用戶下載,用戶對服務進行使用後,將調用 數據自動上傳到系統運行端,也可以由用戶手動將其上傳至伺服器端;
在系統運行端,服務調用通用子模塊由系統通過服務信息生成調用界面,直接對 服務進行調用,其數據採集方式為服務在系統運行端對服務進行使用後,對服務的調用 結果直接進行保存。
服務調用數據初步保存為XML文檔,可以使用XML的解析技術將其進行解析後 存儲入其他媒介中,比如資料庫或者物理文件,服務調用客戶端構建方法可以使用Axis的WSDL2JAVA等工具。服務調用即為HTTP+XML的請求,本系統所採用的保存方法 是每個WSDL對應一個文件夾,其中的操作對應一個存儲服務調用結果的XML文件的 文件夾,每次對服務的調用結果直接存儲為一個XML文件,以操作名與序號結合命名。
服務調用數據存儲文件,通過各類方法獲得的服務調用數據,可以採用很多方式 存儲,比如文本或者資料庫;用資料庫存儲的方法可以通過服務的WSDL中的服務描 述生成資料庫表結構生成SQL語句;當調用次數到達一定上限時,首先運行資料庫表 結構的生成SQL語句生成表結構,然後使用XML解析技術將存儲調用結果XML文檔 導入到對應的資料庫表中。使用文本的存儲方式可以採用如下方法,即使用XML暫存 服務調用結果,使用解析程序將其批量解析入以參數命名的文檔中,嵌套參數生成以父 參數名命名的文件夾,將嵌套數據再存儲入文件夾中。
服務調用數據取樣模塊22用於對服務調用數據粗樣本進行處理,去除噪聲信息, 進行初步的數據挖掘。服務調用數據取樣模塊22包括服務調用緩存、服務取樣存儲庫。
調用信息的取樣不是必需的,調用信息的取樣是為了獲取調用數據中同偏重的數 據,去掉噪聲,以代替初始樣本進行匹配。取樣的方法包括緩存取樣、隨機取樣,然而 並不局限於這兩種取樣方法。
對於緩存取樣來說,用戶服務調用緩存數據用於服務語義匹配意義重大。其一, 由於服務是為用戶提供功能存在的,所以用戶常用的數據對服務調用數據分析的權重更 大。例如, 一個提供中國全部省市的天氣預報服務由於用戶使用的偏向性,査詢省會城 市的用戶佔絕大多數,那麼其與一個只能提供省會城市天氣預報的服務可以視為是基本 等同的;其二, Web服務背後的資料庫的數據量往往非常龐大,並且沒有統一的檢索接 口,所以無法獲得其全部的數據;我們試圖通過分析數據集中具有共同傾向的數據集合 關係,探索全部數據的關係。
一般情況下,用戶對服務的使用往往具有相似的時間分布與聚集分布,所以不同 服務的調用緩存可以視為帶有相同偏向的數據集合;具體的實現方式可以使用最近最少 使用置換(LRU)、先進先出置換(FIFO)和最佳置換(OPT)策略分析服務調用數據,獲取 保留於緩存中的樣本。
對於隨機取樣來說,由於無法獲取Web服務對應的資料庫所有數據,而隨機取樣 數據可以很好的代表整體數據特點;通過這些特徵的對比,可以得到兩個數據集合的是 否相關相似的結論。
關係匹配模塊23用於通過取樣數據進行匹配,得到服務參數之間的關係。關係匹配模塊23包括如下子模塊,即數據對比模塊、特徵向量匹配模塊、文本相似度匹配模 塊、匹配結果存儲庫、匹配結果在計算模塊,所採用的方法有集合對比匹配、文本相似 度匹配、特徵向量匹配,然而並不局限於上述各方法。
數據對比模塊,類Join匹配,通過兩兩比較調用結果,獲得數據集合關係,適用 於緩存取樣等同側重取樣;特徵向量匹配模塊,特徵向量可以包含的信息很多,比如如 下信息①通過服務調用結果抽取的數據統計信息,例如期望、方差、是否存在空、取 值範圍(最大值,最小值),這類信息來自於對服務調用數據的統計分析;②服務模式層 文字類統計信息,如模式名稱長度。這類信息在服務領域指服務的模式描述名稱,即參 數名;③服務設計約束信息,包括數據類型、數據長度、是否可為空。這類信息主要來 自中間件中對WSDL已經解析得到的服務描述。
特徵向量匹配模塊,即是通過計算服務參數額特徵向量之間的距離或者夾角來測 度兩個參數之間關係。
另外還有文本相似度匹配,信息指紋匹配等方式,適用於長度較大的同側重數據。
匹配結果應用模塊24用於通過新挖掘出的服務關係更新服務發現與組合結果。 服務發現的方法是多種多樣的,主要的包括UDDI, P2P網絡,Petri網,散列表等, 其中應用較為廣泛的是倒排索引的方法,圖3是本發明中通過新得到的服務參數關係更 新服務檢索索引的實例示意圖。服務的倒排索引是通過服務元素與關鍵詞之間的關係構 建的。系統首先通過服務描述信息中服務屬性名(參數,操作等)以及屬性值構建初步 的倒排索引,再通過新得到的服務匹配關係對索引進行修正,由於倒排索引的具備檢索 速度快的特點,通過這樣的索引增量構建方式,可以在基本不降低檢索效率的情況下, 將與關鍵詞相關的服務逐漸全部與之建立聯繫,提高系統的査全率。
服務組合結果更新服務組合是指將兩個服務連接起來形成一個新的服務,以滿 足更多的用戶需求,數個服務的組合形成一個組合鏈條。圖4是本發明中通過新得到的 服務參數關係更新服務組合網絡的實例示意圖。途中服務組合鏈條中銜接關係通過新得 到的服務參數關係得到更新。現實中服務的組合索引更加複雜,存儲方式也比較多樣, 在此不進行詳細陳述。
權利要求
1.一種基於調用數據的服務參數關係匹配方法,其特徵在於,包括以下步驟服務調用數據獲取步驟,獲取服務的調用數據;服務調用數據取樣步驟,對服務調用數據粗樣本進行處理,去除噪聲信息,進行初步的數據挖掘;關係匹配步驟,通過取樣數據進行匹配,得到服務參數之間的關係;匹配結果應用步驟,通過新挖掘出的服務關係更新服務發現與組合結果。
2. —種基於調用數據的服務參數關係匹配系統,其特徵在於,包括服務調用數據獲取模塊,用於獲取服務的調用數據;服務調用數據取樣模塊,用於對服務調用數據粗樣本進行處理,去除噪聲信息,進行 初步的數據挖掘;關係匹配模塊,用於通過取樣數據進行匹配,得到服務參數之間的關係; 匹配結果應用模塊,用於通過新挖掘出的服務關係更新服務發現與組合結果。
3. 根據權利要求2所述的基於調用數據的服務參數關係匹配系統,其特徵在於所述服務調用數據獲取模塊包括服務調用通用模塊、客戶端創建模塊、服務調用數據 存儲文件。
4. 根據權利要求2或3所述的基於調用數據的服務參數關係匹配系統,其特徵在於-所述服務調用數據取樣模塊包括服務調用緩存取樣模塊、隨機取樣模塊、服務取樣存 儲庫。
5. 根據權利要求2或3所述的基於調用數據的服務參數關係匹配系統,其特徵在於所述關係匹配模塊包括數據對比模塊、特徵向量匹配模塊、文本相似度匹配模塊、匹 配結果存儲庫。
6. 根據權利要求5所述的基於調用數據的服務參數關係匹配系統,其特徵在於所述特徵向量匹配模塊的特徵向量信息包括通過服務調用結果抽取的數據統計信息、 服務模式層文字類統計信息、服務設計約束信息。
全文摘要
本發明涉及Web服務技術領域,尤其涉及一種基於調用數據的服務參數關係匹配方法及系統。本發明的基於調用數據的服務參數關係匹配方法,包括獲取服務的調用數據的服務調用數據獲取步驟;對服務調用數據粗樣本進行處理,去除噪聲信息,進行初步的數據挖掘的服務調用數據取樣步驟;通過取樣數據進行匹配,得到服務參數之間的關係得關係匹配步驟;通過新挖掘出的服務關係更新服務發現與組合結果的匹配結果應用步驟。本發明具備脫離服務的語義標註得到服務參數匹配關係,隨著調用數據量的增大,準確率提高,並且可以保證準確率的特點。
文檔編號G06F17/30GK101610284SQ20091006320
公開日2009年12月23日 申請日期2009年7月17日 優先權日2009年7月17日
發明者瑩 張, 彭智勇, 承 曾, 歐偉傑, 科 王 申請人:武漢大學