一種基於場理論的本體分析方法
2023-06-08 22:52:11 3
專利名稱:一種基於場理論的本體分析方法
技術領域:
本發明涉及一種基於場理論的本體分析方法,尤指一種基於場理論的本體概念層次化聚類方法。
背景技術:
本體是「概念模型的明確的規範說明」,其作為一種在語義層次上描述信息和數據的概念模型,在知識的獲取、表示、分析和應用等方面發揮著重要的作用。為了使本體有更為廣闊的發展前景,充分發揮知識共享的作用,近年來出現了各種各樣的本體分析方法和工具。本體分析是保證本體工程質量的重要途徑,也是本體選擇及本體復用的基本前提。本體分析涉及本體的正確性、完整性、一致性、可重用性、適用性以及結構特性等多個方面。 ODEval, OntoQA, Core, OntoManage等基於本體的不同側面來分析本體構建規劃、本體構建過程、本體應用以及本體維護等階段出現的問題或錯誤,包括本體句法層面的正確與否、本體設計結構上的合適與否以及本體相對於領域知識表示完整與否等。研究者還從本體結構的特點出發,將本體結構與複雜網絡結構進行類比,借鑑複雜網絡的研究方法和性質參數對本體結構進行研究,對本體的度分布、平均最短路徑、聚集係數等進行統計分析,評估本體概念,考察本體結構特性。研究者還從適應性的角度進行本體分析,通過本體的內聚程度衡量本體適應演化的能力,本體內聚度越低,本體越適合演化,內聚度越高,越不適合演化。然而,在現有技術中,尚沒有一種基於場理論的本體概念層次化聚類技術,可以得到本體概念的層次化聚類譜圖。
發明內容
鑑於以上所述,本發明的目的在於提供一種基於場理論的本體分析方法,從本體概念層次化聚類的角度對本體進行分析。為實現上述目的及其他相關目的,本發明提供一種基於場理論的本體分析方法,至少包括以下步驟I)本體概念預處理的步驟,計算輸入本體的本體概念質量及本體概念間語義相似度;2)概念場構建的步驟,將所述步驟I)中處理過的本體概念影射到多維空間中,空間中的本體概念相互聯繫,共同作用形成概念場;3)初始聚類中心選取的步驟,在所述步驟2)中建立的概念場中選擇本體概念的初始聚類中心;4)概念層次化聚類的步驟,根據所述3)中確定的初始聚類中心,迭代合併初始聚類,形成不同層次的聚類劃分,以本體概念類譜圖的形式展示本體分析的最終結果。於本發明的基於場理論的本體分析方法的步驟I)中,輸入的本體採用OWL語言描述。
於本發明的基於場理論的本體分析方法的步驟I)中,所述本體概念質量的計算採用如下公式
權利要求
1.一種基於場理論的本體分析方法,其特徵在於,所述本體分析方法至少包括以下步驟 1)本體概念預處理的步驟,計算輸入本體的本體概念質量及本體概念間語義相似度; 2)概念場構建的步驟,將所述步驟I)中處理過的本體概念影射到多維空間中,空間中的本體概念相互聯繫,共同作用形成概念場; 3)初始聚類中心選取的步驟,在所述步驟2)中建立的概念場中選擇本體概念的初始聚類中心; 4)概念層次化聚類的步驟,根據所述3)中確定的初始聚類中心,迭代合併初始聚類,形成不同層次的聚類劃分,以本體概念類譜圖的形式展示本體分析的最終結果。
2.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟I)中,輸入的本體採用OWL語言描述。
3.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟I)中,所述本體概念質量的計算採用如下公式
4.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟I)中,所述本體概念間的語義相似度計算採用如下公式
5.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟I)中,根據輸入本體包含的概念集C= Ic1, C2,…,Ci,…,cn},構建一個η維空間Rn,空間的第i維為概念Ci與各本體概念的語義相似度(I ( i ( n),稱RnS輸入本體對應的多維空間。
6.根據權利要求5所述的基於場理論的本體分析方法,其特徵在於輸入本體及其對應的多維空間Ω。,本體概念Ci在語義空間中的位置向量為Xc;i = (sn,Si2,…,Sik,…,sin),向量第k維Sik為概念Ci和概念Ck的語義相似度。
7.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟2)中,給定概念場中的概念集c = Ic1, C2,…,Ci,…,CnI、及概念的位置集P = {xcl,xc2,…,Xci,…,X。J,概念場中任一場點X的勢值為
8.根據權利要求7所述的基於場理論的本體分析方法,其特徵在於所述影響因子σ的取值公式為
9.根據權利要求I所述的基於場理論的本體分析方法,其特徵在于于所述步驟3)及步驟4)中,對於概念場空間進行網格劃分並構建索引樹,根據Hesse矩陣的特徵值對臨界點分類,找出局部極大值點和鞍點,然後,根據局部極大值點選取本體概念的初始聚類中心進行初始劃分,最後,根據鞍點對初始聚類進行迭代合併。
全文摘要
本發明提供一種基於場理論的本體分析方法,首先對本體進行預處理,計算本體概念質量及概念間的語義相似度;然後將本體概念影射到多維空間中,空間中的本體概念相互聯繫,共同作用形成概念場,選取合適的影響因子,使概念場的分布體現本體概念的自組織聚集特性;在概念場中,連接等勢值點即可得到一系列等勢線,等勢線呈現自然嵌套結構,勢心是等勢線在一定範圍內的局部極大值點,反映了本體概念聚集的中心位置。因勢的疊加作用勢心與本體概念不重合,選取距離勢心最近的本體概念作為初始聚類中心,根據兩個局部極大值點之間的鞍點迭代合併初始聚類,形成不同層次的聚類劃分,進而得到本體概念的層次化聚類譜圖,準確度高,並具有良好的可擴展性。
文檔編號G06N5/00GK102779288SQ20121021329
公開日2012年11月14日 申請日期2012年6月26日 優先權日2012年6月26日
發明者周勇, 夏士雄, 張磊, 牛強, 王志曉 申請人:中國礦業大學