新四季網

一種基於相似性度量的模型比對方法

2023-06-11 09:36:46 3

專利名稱:一種基於相似性度量的模型比對方法
技術領域:
本發明涉及計算機科學資料庫領域,尤其涉及一種在半結構化模型上基於相似性度量的比對方法。
背景技術:
版本控制是對系統不同版本進行標識和跟蹤的過程,並且方便於對版本加以區分、檢索和跟蹤,以及表明各個版本之間的關係。而版本的比對則是版本控制中一個重要的模塊,其目的為了讓用戶對當前所用版本有進一步的認識,將當前版本與以前的版本實例進行對比,並且把兩個版本之間的明顯不同清晰的呈現給用戶。經過長時間的發展,傳統的版本比對工具已經比較成熟,傳統的版本比對方法多數是基於行的比對,即標記出相比較的文本某一行存在的差別。對於模型比對,現有的方法 是直接對模型中的文字和結構進行匹配來實現的。雖然相關技術也有了長足的進步,但是當前在建模工具中所用的模型比對方法卻顯得有些不盡如人意。在當前的建模工具的模型比對中,只對兩個模型進行非常簡單的比較,即只有在兩個模型在存儲層面相同時兩個模型才能被認同是相匹配的,而兩個模型中的細微的差別都可能導致比對結果的不同。而用戶所建立的模型往往是基於一些語義關係或者模型中的結構關係,而這些特點顯然不能被整個對比工具所認知,因此,現存的模型比對工具與用戶的需求仍然有一定的距離。而具體來說,當前模型比對方法的不足之處可以概括為如下幾
佔-
^ \\\ · (I)在模型比對時,不能對具有同義關係或相似的語義關係的兩個概念進行判別,很容易就將具有相似語義關係的兩個模型直接區別開來。例如兩個名稱分別為「防護飛彈」與「防禦飛彈」的模型,在用戶看來,它們是一致的,而在模型比對中則會被視為不同的兩個概念來處理。(2)缺乏對異構數據源中的兩個模型關係的認識。由於在建模過程中可能會出現多個團隊,因此,就很容易導致他們對某些模型的認識上存在一定的差異,在相同的模型的表述上存在不同。這樣就直接導致了所生成模型結構的不同。例如對某一圖書庫中的書本模型的表述可以分別是如圖I所示的三個模型。而以上三種表述方法,對用戶來說應當是相同的。(3)不能適用當前比較主流的建模工具的模型比對。在一般的建模工具中,模型在文件上都是以XML的方式進行存儲的,現在針對XML進行比對的方法也層出不窮,但是由於當前模型比對具備了一定建模領域的特點。因此,亟需一種基於相似性度量的模型比對方法以解決上述問題。

發明內容
本發明所要解決的技術問題之一是需要提供一種能夠使得模型比對的結果更加準確、客觀的基於相似性度量的模型比對方法。
為了解決上述技術問題,本發明提供了一種基於相似性度量的模型比對方法,該方法包括步驟10,確定待比對的模型;步驟20,分別從所述待比對的模型中獲取組成各個模型的節點;步驟30,計算所述待比對模型之間各個節點的節點相似度;步驟40,基於所述待比對模型之間各個節點的節點相似度計算得到所述待比對模型之間的模型相似度;步驟50,基於所述模型相似度以得到所述待比對模型之間的關係。根據本發明另一方面的基於相似性度量的模型比對方法,在所述步驟30中,通過計算所述待比對模型之間各個節點的節點文本相似度和節點標籤相似度、以得到所述待比對模型之間各個節點的節點相似度。根據本發明另一方面的基於相似性度量的模型比對方法,基於各個節點所對應的標籤之間的語義關係以得到所述待對比模型之間各個節點的節點標籤相似度。根據本發明另一方面的基於相似性度量的模型比對方法,基於各個節點之間的字符串編輯距離來得到所述待比對模型之間各個節點的節點文本相似度。根據本發明另一方面的基於相似性度量的模型比對方法,所述待比對模型之間各個節點利用以下表達式來得到節點文本相似度
權利要求
1.一種基於相似性度量的模型比對方法,其特徵在於,包括 步驟10,確定待比對的模型; 步驟20,分別從所述待比對的模型中獲取組成各個模型的節點; 步驟30,計算所述待比對模型之間各個節點的節點相似度; 步驟40,基於所述待比對模型之間各個節點的節點相似度計算得到所述待比對模型之間的模型相似度; 步驟50,基於所述模型相似度以得到所述待比對模型之間的關係。
2.根據權利要求I所述的方法,其特徵在於,在所述步驟30中, 通過計算所述待比對模型之間各個節點的節點文本相似度和節點標籤相似度、以得到所述待比對模型之間各個節點的節點相似度。
3.根據權利要求2所述的方法,其特徵在於, 基於各個節點所對應的標籤之間的語義關係以得到所述待對比模型之間各個節點的節點標籤相似度。
4.根據權利要求2所述的方法,其特徵在於, 基於各個節點之間的字符串編輯距離來得到所述待比對模型之間各個節點的節點文本相似度。
5.根據權利要求4所述的方法,其特徵在於, 所述待比對模型之間各個節點利用以下表達式來得到節點文本相似度
6.根據權利要求2至5任一項所述的方法,其特徵在於, 所述待比對模型之間各個節點利用如下表達式來得到所述待比對模型之間各個節點的節點相似度
7.根據權利要求I所述的方法,其特徵在於,在所述步驟40中,具體包括以下步驟 步驟41,基於所述各個節點的節點相似度計算得到所述待比對模型之間各個路徑的路徑相似度和各個層次的層次相似度; 步驟42,基於所述各個路徑的路徑相似度和所述各個層次的層次相似度以得到所述待比對模型之間的模型相似度, 其中,所述路徑為待比對模型的樹結構中從根節點到葉子節點所經由的節點組成的串。
8.根據權利要求7所述的方法,其特徵在於,在所述步驟41中,利用所述各個節點的節點相似度,基於最長公共子序列法和/或層次法得到所述待比對模型之間各個路徑的路徑相似度。
9.根據權利要求7或8任一項所述的方法,其特徵在於,在所述步驟41中, 利用以下表達式得到待比對模型之間各個層次的層次相似度
10.根據權利要求7所述的方法,其特徵在於,在所述步驟42中,具體包括以下步驟 步驟421,基於所述各個路徑的路徑相似度得到待比對模型之間的模型縱向相似度; 步驟422,基於所述各個層次的層次相似度得到待比對模型之間的模型橫向相似度; 步驟423,基於所述模型縱向相似度和/或模型橫向相似度以得到待比對模型之間的模型相似度。
11.根據權利要求10所述的方法,其特徵在於,在所述步驟421中, 所述待比對模型利用如下表達式得到待比對模型之間的模型縱向相似度
12.根據權利要求10所述的方法,其特徵在於,所述步驟422中, 利用以下表達式得到待比對模型之間的模型橫向相似度
13.根據權利要求7至12任一項所述的方法,其特徵在於,在所述步驟50中, 將所述模型相似度與設定閾值進行比較以得到待比對模型之間的關係。
全文摘要
本發明公開了一種基於相似性度量的模型比對方法,該方法包括步驟10,確定待比對的模型;步驟20,分別從所述待比對的模型中獲取組成各個模型的節點;步驟30,計算所述待比對模型之間各個節點的節點相似度;步驟40,基於所述待比對模型之間各個節點的節點相似度計算得到所述待比對模型之間的模型相似度;步驟50,基於所述模型相似度以得到所述待比對模型之間的關係。本發明方法因為在計算節點相似度時採用了文本相似度與標籤相似度相結合的手段,克服了僅僅考慮文本而忽略模型元素標籤特性的問題,進而使節點相似度更能反映模型的實際情況。
文檔編號G06F17/30GK102722556SQ20121017125
公開日2012年10月10日 申請日期2012年5月29日 優先權日2012年5月29日
發明者任博巖, 徐哲, 徐文華, 李金星, 王珍, 王瑤, 胡浩, 覃徵, 趙鳳飛 申請人:清華大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀