新四季網

一種基於語義網的信息查詢方法

2023-09-18 15:22:40

一種基於語義網的信息查詢方法
【專利摘要】本發明涉公開了一種基於語義網的信息查詢方法,用於根據特定的語義查詢語句在本體庫中查找與語義查詢語句相匹配的本體類實例並對查詢結果進行排序,所述方法包括以下步驟:S101、遍曆本體實例圖。S103、根據所述的本體類實例與各查詢關鍵字之間的語義關係路徑的權重和語義關係路徑的數量,綜合計算當前本體類實例與查詢關鍵字之間的相關性。104根據所述的本體類實例與各查詢關鍵字之間的相關性以及各查詢關鍵字的權重,綜合計算每個本體類實例與查詢關鍵字集合之間的相關性。S105、按照所述相關性從大到小的順序對所述的本體類實例進行排序。本發明有效提高了語義網信息查詢的查準率和查全率。
【專利說明】一種基於語義網的信息查詢方法

【技術領域】
[0001]本發明涉及信息網絡【技術領域】,特別是涉及一種基於語義網的信息查詢方法。

【背景技術】
[0002]傳統的信息查詢技術主要使用基於關鍵字的查詢方法,該方法主要通過把表徵用戶查詢請求的關鍵字與資源的信息內容進行嚴格的機械匹配來實現。由於關鍵字的查詢方法本身缺少知識表示和語義處理能力,僅僅進行關鍵字的匹配無法反映用戶查詢請求中的語義關係,從而導致查詢結果的查準率偏低。語義網是由Tim Berners-Lee提出的一種新型網絡體系結構,它能夠為網絡中的源文檔添加語義信息,從而使計算機能夠理解語義信息文檔。本體是實現語義網的關鍵技術,它是知識表示的重要方法,能以一種形式化的、機器可處理的表示來描述概念之間的語義。由於本體具有良好的概念層次結構和對邏輯推理的支持,因而在信息檢索中得到了廣泛的應用。
[0003]近年來,國內外已經有許多基於語義網的查詢技術的研究。Liu等通過構建一個基於關鍵詞及其之間語義關係的概念關係圖,實現了對關鍵字查詢過程中語義關係的識別,但這一算法缺少對語義關係的權重分析以及對查詢結果的排序。Castells等提出了一種基於本體的信息檢索框架,該框架使用算法對每個語義關係賦以權重,並對查詢結果按照向量空間模型進行排序,然而這一算法對語義關係的權重計算粒度較粗,並且忽略了語義關係之間的差異。Zhou等提出了一種基於關係模型的連結排序方法,該算法通過構建具有主、外鍵關係模型的連結結構,從而實現對查詢結果的排序,但這一算法沒有考慮連結之間的特異性和多樣性以及關鍵字的涵蓋範圍和識別能力等問題。因此,如何提高語義網查詢的有效性和準確性仍是信息檢索領域研究的重點和難點。
[0004]本體是描述概念及概念之間語義關係的數據模型,它能夠通過概念之間的關係來描述概念的語義,本體通常由Schema及其實例組成,它被表示在一個包括RDF特徵、對象屬性、數據類型屬性以及反向屬性的OWL-Lite子集中,通常具有以下定義:
[0005]定義ISchema S被定義為三元組〈C,D,P〉,其中C是類集,D是數據類型集,P是屬性集。所有類、屬性和數據類型都通過URI被準確表示,並且對於任意d e C,r e C U D,有屬性p(d, r) e P,其中d和r分別被稱為ρ的領域和範圍。
[0006]定義2基於Schema S =〈C,D,P〉的實例圖被定義為一個有向圖G =〈V,E>,其中V是實例集,E是V中實例間的關係集。在實體圖中,一個資源表示一個類的實例。令[c]表示實例C e C U D的一個集合,對於每個ν e V,當V.type = c時,貝U v e [c]。令[p (d, r)]表示屬性實例P(d,r) e P的集合,對於每個e (Vi, ν」)e E,當e = p, Vi e [d], Vj e [r]時,則e (Vi, Vj) e [p (d, r)],其中Vi和Vj分別為e的主體和客體。
[0007]定義3語義路徑sp是Schema S =〈C, D, P〉中的一個屬性序列P1 ((I1, r)P2 (d2, r2)...pm(dm, rm),其中Pi (屯,e P並且巧和di+1是相同的類或具有相同的父類。
[0008]定義4 對於語義路徑 sp = P1 (d」 T1) p2 (d2, r2)…pm (dm, rm), ip = e! (S1, O1)e2(s2, o2) "'(Sm, om)是sp的一個語義路徑實例,當ei (Si, Oi) e [Pi(C^ri)]並且對於所有h有Oi = si+1時,貝丨J S1, om分別是ip的源和目的。
[0009]定義5用戶查詢Q被定義為二元組〈T,K〉,其中T是類集,K是關鍵字集。對於一個給定的Schema S =〈C,D, P〉以及一個基於S的實例圖G =〈V,E>,語義搜索就是查找Q=<T, K〉的答案集Α,其中T e C。對於每個資源a e A,需要在G中至少有一個從資源a到數值為s的語義路徑實例,其中a e [T]且數值s包含關鍵字k e K。


【發明內容】

[0010]為克服以上存在的問題,本發明提出了如下的技術方案:
[0011]一種基於語義網的信息查詢方法,用於根據特定的語義查詢語句在本體庫中查找與語義查詢語句相匹配的本體類實例並對查詢結果進行排序,其包括以下步驟:
[0012]S101、遍曆本體實例圖,並返回與語義查詢語句中的本體類型相匹配,且與語義查詢語句中的查詢關鍵字相關聯的本體類實例。
[0013]S102、針對所述的每個本體類實例分別查找當前本體類實例與各查詢關鍵字之間的所有的語義關係路徑,並分別計算語義關係路徑的權重。
[0014]S103、根據所述的本體類實例與各查詢關鍵字之間的語義關係路徑的權重和語義關係路徑的數量,綜合計算當前本體類實例與查詢關鍵字之間的相關性。
[0015]S104根據所述的本體類實例與各查詢關鍵字之間的相關性以及各查詢關鍵字的權重,綜合計算每個本體類實例與查詢關鍵字集合之間的相關性。
[0016]S105、按照所述相關性從大到小的順序對所述的本體類實例進行排序。
[0017]進一步的,步驟102中所述的計算語義關係的權重具體包括:
[0018]S2011、計算本體框架圖中各本體類之間以及本體類與數據類型之間屬性的權重。
[0019]S2012、根據本體框架圖中的各屬性的權重計算本體類到數據類型之間的語義關係路徑的權重。
[0020]S2013、使用本體框架圖中的語義關係路徑的權重替代本體實例圖中所對應的語義關係路徑實例的權重。
[0021]進一步的,所述步驟S2011具體計算方法為:
[0022]w (p (d, r)) = α.I (p (d, r)) + β.MI (ρ (d, r))
[0023]式中,p(d, r)表示從本體框架圖中本體類d到本體類或本體數據類型r的屬性,I (P (d, r))表示屬性ρ (d, r)發生時所產生的信息量,MI (p (d, r))表示屬性p (d, r)在d和r之間的相互信息度量值,α, β分別為權重參數,且OS α, β ^ 10
[0024]其中,所述的I (ρ (d, r))具體計算方法為:

【權利要求】
1.一種基於語義網的信息查詢方法,用於根據特定的語義查詢語句在本體庫中查找與語義查詢語句相匹配的本體類實例並對查詢結果進行排序,其特徵包括以下步驟: 5101、遍曆本體實例圖,並返回與語義查詢語句中的本體類型相匹配,且與語義查詢語句中的查詢關鍵字相關聯的本體類實例。 5102、針對所述的每個本體類實例分別查找當前本體類實例與各查詢關鍵字之間的所有的語義關係路徑,並分別計算語義關係路徑的權重。 5103、根據所述的本體類實例與各查詢關鍵字之間的語義關係路徑的權重和語義關係路徑的數量,綜合計算當前本體類實例與查詢關鍵字之間的相關性。 S104根據所述的本體類實例與各查詢關鍵字之間的相關性以及各查詢關鍵字的權重,綜合計算每個本體類實例與查詢關鍵字集合之間的相關性。 S105、按照所述相關性從大到小的順序對所述的本體類實例進行排序。
2.根據權利要求1所述的方法,其特徵在於,步驟102計算語義關係的權重具體包括: 52011、計算本體框架圖中各本體類之間以及本體類與數據類型之間屬性的權重。 52012、根據本體框架圖中的各屬性的權重計算本體類到數據類型之間的語義關係路徑的權重。 S2013使用本體框架圖中的語義關係路徑的權重替代本體實例圖中所對應的語義關係路徑實例的權重。
3.根據權利要求2所述的方法,其特徵在於,所述步驟S2011具體計算方法為:
w (p (d, r)) = α.I (p (d, r)) + β.MI (p (d, r)) 式中,ρ (d, r)表示從本體框架圖中本體類d到本體類或本體數據類型r的屬性,I (P (d, r))表示屬性ρ (d, r)發生時所產生的信息量,MI (p (d, r))表示屬性p (d, r)在d和r之間的相互信息度量值,α, β分別為權重參數,且OS α, β ^ 10
4.根據權利要求3所述的方法,其特徵在於,所述的I(p (d,r))具體計算方法為:
式中pr(p(d,r))為屬性p(d,r)的出現概率,sub (p (d, r))為本體實例圖中所有從本體類d的實例到本體類或數據類型r的實例的屬性實例的數量,N為本體實例圖中所有類實例的數量。
5.根據權利要求3所述的方法,其特徵在於,所述的MI(ρ (d,r))具體計算方法為:
式中pr (s, o)為本體實例圖中從本體類d的實例s到本體類或數據類型r的實例ο的屬性實例的出現概率,Pr (s)為本體實例圖中從本體類d的實例s到本體類或數據類型r的所有實例的屬性實例的出現概率,Pr (ο)為本體實例圖中從本體類d的所有實例到本體類或數據類型r的實例ο的屬性實例的出現概率。
6.根據權利要求2所述的方法,其特徵在於,所述步驟S2012具體計算方法為:
式中sp表示從本體框架圖中本體類到數據類型的語義關係路徑,w(p(d,r))表示該關係路徑所包含的各屬性的權重,δ為區間為(O,I)的衰減指數,length (sp)為語義路徑sp包含的屬性數量,P (d, r)表示從本體框架圖中本體類d到本體類或本體數據類型r的屬性。
7.根據權利要求2所述的方法,其特徵在於,所述步驟S2013具體計算方法為:
式中ip表示與本體框架圖中的語義關係路徑sp所對應的本體實例圖中的語義關係路徑實例。
8.根據權利要求1所述的方法,其特徵在於,所述步驟S103具體計算方法為:
式中a表示本體類實例,Iii表示查詢關鍵詞,ip表示語義關係路徑實例,IP (a, Iii)表示從類實例a到數據值為關鍵 字Ici的語義關係路徑實例集合w (ip)表示語義關係路徑ip的權重,spec (ip)表示路徑實例ip的特異性,計算公式如下:
表示路徑實例ip所包含的第i個本體類實例,ei表示以本體類實例Si為主體的屬性實例,degree (Si, ej表示以本體類實例Si為主體的所有屬性實例Oi的數量,m表示路徑實例ip所包含的本體類實例的數量。
9.根據權利要求3所述的方法,其特徵在於,所述步驟S104具體計算方法為:
式中a表示本體類實例,K表示查詢關鍵字集合,ki表示K中第i個關鍵字,|κ|表示集合K中的元素數量,D CO表示關鍵字ki的權重,D CO計算公式如下:
D(L)=丨 og
\DVki\ 式中,|dv|表示語義實例圖中所有數據值的數量,IDvkiI表示語義實例圖中所有包含關鍵字ki的數據值的數量。NR(a,ki)表示均值化後的本體類實例a與查詢關鍵字Iii之間的相關性,NR(a, Iii)計算公式如下:
式中,R(a, ki)表示本體類實例a到查詢關鍵字Ici的相關性,max{}表示取最大值。ρ為調節參數,且P>0。
【文檔編號】G06F17/30GK104166670SQ201410268256
【公開日】2014年11月26日 申請日期:2014年6月17日 優先權日:2014年6月17日
【發明者】夏美翠, 時鴻濤, 姜華, 範玉堂, 姜翠娥 申請人:青島農業大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀