新四季網

一種智能Web查詢接口系統及其方法

2023-10-06 02:00:29 2


專利名稱::一種智能Web查詢接口系統及其方法
技術領域:
:本發明涉及Web數據管理領域,特別是涉及一種智能Web查詢接口系糹充及方法。
背景技術:
:隨著WorldWideWeb的不斷發展,Web上的在線翁:據庫越來越多,尤其是在網上購物、工作招聘、房屋租賃等領域。這些Web資料庫中存儲的信息與淺層蚋頁信息相比,專業性強,因而更具有價值;然而,因為它們並不是以靜態網頁的方式呈現在用戶面前的,因此不能有效地由傳統的搜尋引擎(Google、Baidu等)通過靜態連結直接得到。一般的,網站將所有信息都存儲在後臺資料庫中,並向前端用戶提供可提交查詢的表單,稱為查詢接口。用戶可以通過在網站提供的查詢頁面上輸入查詢條件,向後臺伺服器提交查詢,底層資料庫會將查詢結果以結果頁面的形式返回給用戶。而在這樣的查詢過程中,用戶每次只能向特定一個資料庫提交查詢,想要獲得更為全面的資源就只能向不同Web資料庫多次提交查詢,十分地不便。Web資料庫集成系統解決了此問題。它為用戶提供了一個全局的訪問入口,即複雜集成接口,複雜集成接口具有更強的查詢能力,可以通過它一次查詢訪問多個Web資料庫,並將得到的信息集成起來,從而為用戶提供最全面的信息來源。複雜集成接口集成了其相關領域Web資料庫查詢接口上的所有屬性和屬性值,支持的查詢語義豐富。但相對地,由於追求屬性及選項的全面性,使得查詢接口變得越來越複雜,不易使用。複雜集成接口的主要缺點是1.一個複雜集成接口只能局限於一個特定領域。目前的集成方法都是試圖集成單一領域中的查詢接口,不同的領域有不同的複雜集成接口,用戶無法通過一個統一的集成接口訪問到多個領域。2.複雜集成接口單一屬性上不支持值的"或"邏輯。用戶需要時,只能通過多次填寫複雜集成接口完成。3.複雜集成接口包含過多可填寫的屬性。接口上多達幾十種的屬性讓用戶很難快速定位到自己想要填寫的屬性,從用戶體驗的角度來說這是非常不好的設計。4.複雜集成接口上部分屬性的候選值過多。如在找工作領域,像職業類別、工作地區、行業類別等屬性的候選值往往上百。另一方面有時候選值的粒度不同,值的含義接近,界限模糊,使用戶選擇起來非常不便。由於以上缺點,用戶無法通過一個查詢接口對不同領域進行查找,因此目前的集成系統,例如一個電子商務網站只能採用在不同領域使用各自的高級查詢接口,通過網站的購物目錄,用戶才可以連結到不同查詢接口網頁。然而一個用戶可能一次想要查詢多種產品,而這些產品往往不屬於一個領域,這種情況下,用戶不得不多次往返與商品目錄網頁與查詢接口網頁,並且對與不同的查詢接口都要經歷一個適應的過程,造成極大的不便,降低用戶對網站的興趣。隨著網站規模的擴大,購物的種類越來越多,要求用戶遴選出需要的領域,再進入特定的複雜查詢接口提交查詢,是非常不便的。由此可見,目前的複雜集成接口的用戶友好度是需要研究和改善的。集成系統需要一種更加簡潔和便利的查詢方式,使得用戶不再需要花費額外的時間考慮查詢的領域或者熟悉一個冗長的表單。目前大多悽t網站都提供了兩種查詢方式,即快速查詢(quicksearch)與高級查詢(advancesearch),分別提供了關鍵字形式與結構化形式的查詢,兼顧了不同用戶的需求。然而,作為結構化查詢的極端,複雜集成接口由於過於龐大而造成了用戶的不便,急需一種不減弱集成系統查詢能力的簡化的模式。
發明內容為了解決上述傳統問題,因此本發明的一個目的就是提出了一種智能Web查詢4妄口系統及其方法。在本發明的一個方面中,一種智能Web查詢,接口系統包括領域知識庫,用於存儲每個候選領域的領域模型;智能查詢接口,用戶在該智能查詢接口上填寫查詢條件單元並將用戶的每個查詢分解為一組查詢條件單元;領域匹配模塊,用於根據存儲在領域知識庫中的信息計算出用戶查詢與每個候選領域的匹配度,並選出最相關的領域提供給用戶參考;以及查詢轉換;漠塊,用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成^"口。在本發明的一個方面中,一種用在智能Web查詢接口系統上的方法,該智能Web查詢接口系統包括用於存儲每個候選領域模型的領域知識庫、智能Web查詢接口、領域匹配模塊、查詢轉換模塊,其特徵在於,該方法包括步驟接口輸入步驟,用戶在智能Web查詢>|妄口上填寫查詢條件單元並將用戶的每個查詢分解為一組查詢條件單元;領域匹配步驟,用於根據存儲在領域知識庫中的信息計算出用戶查詢與每個候選領域的匹配度,並選出最相關的領域提供給用戶參考;以及查詢轉換步驟,用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。根據本發明的方面,其中查詢條件單元包含的是在同一屬性上的一個或多個條件值,每個查詢條件單元內部都是"或"的關係。根據本發明的方面,其中領域匹配模塊進一步包括分解模塊,用於分解用戶查詢;一次過濾模塊,當用戶查詢包含領域信息時,利用CT中的詞彙對查詢進行一次過濾,預先去除與查詢毫不相干的那些領域;過濾領域模塊,當預先確定了用戶輸入的某個詞是一個特殊的屬性名稱時,系統將自動將這個詞尾隨的符合該屬性數據類型的詞看作用戶在這個屬性上的條件值,並將二者看作一個統一的整體;計算模塊,用於計算相似度;排序模塊,用於根據領域與查詢的匹配度而對所有集成系統中的候選領域進行由高至低的排序;返回模塊,用於返回其中匹配度最高的k個領域。根據本發明的方面,其中查詢轉換模塊進一步包括:計算匹配度模塊,用於初始化矩陣,計算每一個單元匹配的匹配度;分裂模塊,用於按數據類型分裂匹配度矩陣;行優化模塊,用於進行行優化;計算可信度模塊,用於計算候選查詢轉換解的可信度;排序模塊,用於對所計算的可信度按照由大至小的順序排序;獲得模塊,用於對排好序的每一個候選查詢轉換解,如果它的可信度大於預先設定的閱值e,則輸出並獲得TopK解。根據本發明的方面,其中分裂模塊將初始的匹配度矩陣按照數據類型分裂,具有相同數據類型的關鍵詞單元和屬性形成子矩陣,並在各個子矩陣上形成候選的單元匹配集合。根據本發明的方面,其中行優化分為唯一值優化和最優值優化。根據本發明的方面,其中唯一值優化是如果匹配度矩陣中存在一行,只有一個大於0的匹配度值,那麼這個單元所對應的匹配^皮確定,即最終的查詢轉換解中都應該包含這個匹配,並將這個單元所在的行從匹配度矩陣中移除,再重新掃描,如果還有符合行優化條件的行,則再次確定相應的單元,並移除其所在的行列,直到不再出現滿足條件的行為止。根據本發明的方面,其中最優值優化是矩陣上如果每行都有多於一個大於零的匹配度值,那麼考慮最優值優化,即在行中是否存在唯一的DM值為1的單元,因為DM值為l,表示在這個查詢條件單元在這個屬性的詞典中準確地出現,那麼這個查詢條件單元與這個屬性的匹配可以被確認為最佳匹配,那麼它也可以被預先確定下來。結合隨後的附圖,從下面的詳細說明中可顯而易見的得出本發明的上述及其他目的、特徵及優點。在附圖中圖1給出了根據本發明的智能Web查詢接口系統的整體框架;圖2給出了根據本發明的領域模型建立過程;圖3給出了根據本發明的領城匹配模塊的方框圖;圖4給出了根據本發明的領域匹配流程圖;圖5給出了根據本發明的查詢轉換模塊的方框圖;圖6給出了根據本發明的查詢轉換流程圖;圖7給出了根據本發明的匹配度矩陣分裂示例;圖8給出了根據本發明的查詢轉換模塊中的行優化模塊的流程圖。具體實施方式首先,根據圖1,對根據本發明的智能Web查詢接口系統的整體框架進行詳細的i兌明。智能Web查詢接口系統提供了高級查詢任務的筒單形式。用戶的查詢首先通過領域匹配模塊來預估用戶查詢的領域,之後查詢轉換模塊將其轉換成複雜接口上的可適應查詢,之後再向下分派到各個網站。系統的總體框架如圖1所示。智能Web查詢接口的工作集中在它的後臺處理模塊,實現自動的領域匹配和處理用戶查詢向複雜集成接口查詢轉換。首先,用戶在智能Web查詢接口1上填寫查詢並將用戶的每個查詢分解為一組查詢條件單元(一個查詢條件單元包含的是在同一屬性上的一個或多個條件值)。每個查詢條件單元內部都是"或"的關係。在查詢轉換時,每個關鍵詞單元都被看作是同一個屬性上取的多個屬性值。解析器在該步驟中預先作一些清洗的工作,去除一些無關的"停止詞",並確定每個關鍵詞單元的數據類型。例如用戶查詢(H北京或天津,教育類,2000-3000},轉換為U廣{北京,天津},邏輯或;U2={教育};U3={2000,3000},邏輯範圍。之後,用戶的查詢被送往領域匹配模塊2,根據存儲在領域知識庫3中的信息(即每個候選領域D),計算出用戶查詢與每個候選領域D的匹配度,並選出最相關的領域提供給用戶參考。進行完領域匹配後,開始進入查詢轉換模塊4,經過複雜的計算,建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。隨後對領域匹配模塊2和查詢轉換模塊4進行詳細的說明。接下來,對領域模型的建立過程進行詳細的描述。領域匹配的關鍵是建立領域信息的模型,模型的建立過程如圖2所示。首先由"收集器"從Web資料庫6中收集的各領域的查詢接口上損^又能突出代表該領域的重要屬性和特殊屬性值的一系列單詞,權值分派器8將這些單詞按照其代表能力的差別進行權值分配,最終將領域模型存儲在領域知識庫3中。定義l領域模型DM-cg^7;IT>,其中D:表示一個領域;CO(ctiIi=1,2,...}:是一組概念詞的集合,用來總體性地描述領域的概念,在本系統中,藉助了Yahoo層次模型中各個概念層次的詞彙來擴充CC集合;此外,還借用了WordNet中同義詞,上位詞/下位詞作為補充。AT=UAeDLa(D,A;):是由這個領域內各查詢接口所包含的屬性的屬性標籤組成的詞彙的集合。La(D,Ai)指在領域D中,與某個屬性Ai相關的所有標籤詞彙的集合。這個集合中的詞彙可以分為三類①集成接口上的標籤名;②各個Web資料庫的查詢接口上釆用的標籤名;③前面兩大類標籤名的同義詞和上位詞/下位詞。VT=UA6DVa(D,Ai):是由這個領域內所包含的屬性的候選值單詞的集合。對於大部分的屬性,其屬性值是一個收斂的有限集合。Va(D,Ai),即領域屬性值集合表示在領域D中,屬性Ai的所有預定義的屬性值。依據屬性的不同數據類型,Va(D,Ai)基本可以分為兩大類進行討論文本型和非文本型。領域模型中的各個詞在區分一個領域和其他領域的能力上是不同的,因此我們需要設定一種權重,來反映不同詞彙在領域模型中的代表性。這裡我們參考了這一
技術領域:
中已有的線索有效性變量(cuevalidityvariance)簡稱CVV計算方法,定義如下公式(1)對於文本詞公式1:formulaseeoriginaldocumentpage10公式2:formulaseeoriginaldocumentpage10其中ifij為查詢接口出現頻率,代表某個詞tj,它在第i個領域Di中出現的頻率。公式3:formulaseeoriginaldocumentpage10其中ifip為詞tp在查詢接口上出現的頻率,tp它是領域Di中一個可見詞tj的同義詞或上4立/下4立詞。(2)對於範圍詞要計算範圍型的權重有兩個前提①只有具有相同數據單位的兩個範圍才可以做比較。②兩個範圍是一樣的,必須擁有相同的最大值和最小值。如果兩個範圍值並不完全相同,但卻又存在相交的局部,則採取了範圍進一步細分的機制,使得任意兩個範圍值或者相同,或者完全不相交。參考圖3,對根據本發明的領域匹配模塊的方框圖進行說明。該領域匹配模塊用於計算出用戶查詢與每個候選領域D的匹配度,並選出最相關的領域提供給用戶參考。如圖3所示,領域匹配模塊包括分解模塊,用於分解用戶查詢;一次過濾模塊,當用戶查詢包含領域信息時,利用CT中的詞彙對查詢進行一次過濾,預先去除與查詢亳不相干的那些領域;過濾領域模塊,當預先確定了用戶輸入的某個詞是一個特殊的屬性名稱時,系統將自動將這個詞尾隨的符合該屬性數據類型的詞看作用戶在這個屬性上的條件值,並將二者看作一個統一的整體;計算模塊,用於計算相似度;排序模塊,用於根據領域與查詢的匹配度而對所有集成系統中的候選領域進行由高至低的排序;返回模塊,用於返回其中匹配度最高的k個領域,其中k(預先定義的返回結果數)。下面結合圖4,對領域匹配模塊的具體領域匹配流程進行的說明。對於用戶查詢Q-0ii,u2,…,uj,uHvi1,Vi2,…H十算一個用戶查詢Q和每個領域D之間的相關度如圖4所示。步驟l(Sl):分解用戶查詢採用分詞程序將一個用戶查詢分解為若干的條件單元,即,用戶查詢Q={Ul,u2,…,Un),對於一個條件單元,它可能包含了多於一個的查詢條件值,即,Ui—Vi1,Vi2,...}。因此,Q與D的相關度就需要先計算每個條件單元ih與領域D的相關度。步驟2(S2):—次過濾當用戶查詢包含領域信息時,利用CT中的詞彙對查詢進行一次過濾,預先去除與查詢毫不相千的那些領域,從而縮小候選領域集合,減少匹配計算量。步驟3(S3):過濾領域當預先確定了用戶輸入的某個詞是一個特殊的屬性名稱時,系統將自動將這個詞尾隨的符合該屬性數據類型的詞看作用戶在這個屬性上的條件值,並將二者看作一個統一的整體。那麼它的相關度計算就是max(sl,s2},其中sl表示屬性名稱的相似度值,而s2表示屬性值的相似度計算值。步驟4(S4):計算相似度先考慮v,是文本型值的情況。對於Ti中的每一個詞(Ti來表示領域Di的表示模型中所有詞彙的集合)tj,計算vj和tj的相似度。一般的,採用字符串相似度的比較公式公式4&mO,.,g=其中cw表示v,和tj中最長公共字串的長度。當ViX不是文本型屬性時,Sim(v。t》取決於兩個範圍vj和tj覆蓋的範圍,計算公式為以上兩種情況(ViX為文本類型和非文本類型),我們總是從Ti中選擇相似度最高的一個作為與vj最匹配的詞,記為t人記錄這個最大的相似度值maxJ57m(v;V;^=若存在不止一個滿足的C,那麼選擇擁有最大的Weight(D,t"的那個作為最終的t人定義了Sim(Vix,tj)的基礎上,可以到處關^:詞單元Ui與領域D的相關度,記為Sim(Ui,D),公式6S/附(仏,D)=maxxW附(vf,。}詞單元與D的相關度的加權和。計算公式為公式75Jw(g,D卜玄Sm("f,D)噴eigfe(D,。公式5max(v;",其中cr為vZ和tj的公共範圍。步驟5(S5):排序並返回Topk領域對於所有集成系統中的候選領域,我們才艮據領域與查詢的匹配度由高至低進行排序。步驟6(S6):返回Topk領域最後,返回其中匹配度最高的k個領域。在這裡,k是一個可調整的變量,它與一個閾值a相關,當排序後的領域列表中,連續兩個候選領域匹配度的差值大於(7時,排在這兩個候選領域之後的領域將不再被返回。7>式8如果(&>(Q,)-5V附(2,A+1))-(&'w(Q,",一)-&'附(^,A))>o"則k=i,即排在Di之後的領域將被系統捨棄,不再返回給用戶。通過實驗數據,將a定為0.2實驗效果最佳。關鍵詞查詢與複雜集成接口上的查詢最大的區別在於前者不確定關鍵詞相關的屬性是什麼。查詢轉換的難點就是找到並構建關鍵詞單元與複雜接口上屬性的關聯。查詢轉換的問題是利用用戶提交的關鍵詞構造複雜接口上的一個或一組查詢。總體來說這個過程可以分為這樣三個步驟首先,是對用戶提交的關鍵詞作一個預處理,將這些關鍵詞按照其針對的屬性不同,劃分成不同的條件單元;然後,建立各個關鍵詞單元和複雜接口上屬性的對應關係,當然由於用戶提交的關鍵詞語義可能存在一定的模糊性,對應關係可能並非只有一對一的情況,也有一對多,甚至還有某些關鍵詞可能在複雜接口上找不到與之匹配的屬性;若為每個關鍵詞單元選擇一個可能的匹配屬性,將它們組合起來,就可以得到一個查詢轉換的方案,稱為查詢轉換解。最後,由於不同的組合可以得到不同的查詢轉換解,需要在其中選擇總體上查詢語義最接近用戶本意的解並依據它生成最後的查詢。首先我們介紹一下計算模型。定義2M(u,A)稱為一個單元匹配,是指在一個查詢單元u和複雜接口上的一個屬性A之間建立的匹配。若u不匹配到任何屬性,則記為M(u,nil);定義3DoM(u,A)稱為單元匹配M(u,A〉的匹配度,用來衡量一個單元匹配的可信程度。表一是k個條件單元與m個屬性可以構成匹配度矩陣<表一匹配度矩陣tableseeoriginaldocumentpage14定義4查詢轉換解S,它可以產生一個填寫複雜接口上查詢的方案,由k個單元匹配的合取構成,其中k是條件單元的個數;並且,不存在兩個單元匹配包含相同的關鍵詞單元或複雜集成接口上的同一屬性。一個查詢轉:l奐解可以記為M(u!,AxjAM(u2,Ax2)A...AM(uk,Axk)。其中,AXi表示Ui對應的屬性,可以為nil。並且(1)每個關^t詞單元v都有一個匹配,或者匹配到屬性A,或者匹配到nil;(2)不同關鍵詞單元對應不同的屬性。不存在某個屬性可以同時對應多個關鍵詞單元。定義5Confidence(S)為查詢轉換解的可信度,是衡量一個解的優劣程度的值。它與單元的匹配度值密切相關。當枚舉所有的單元匹配的組合,得到全部的查詢轉換解,對每個解,都可以利用Confidence估算它的好壞。我們將所有的解按照其Confidence值由大至小排序,選擇值較理想的查詢轉換解為基礎生成最後的查詢。下面介紹一下DoM計算方法公式9formulaseeoriginaldocumentpage14a表示的是Vi與Aj的匹配無法確定,因此它的取值應該大於確定不匹配的情況時的取值O,而小於在詞典中發現匹配的情況的取值。實現中設定cc為0.3。最後,DoM(u,Aj)是對vi中包含的關^t詞的Sim值的總體評價;系統中採用它們的算術平均值公式formulaseeoriginaldocumentpage15若u不匹配任何屬性,那麼(",)的值為0。接下來介紹一下Confidence計算方法首先定義權值w,它與相應的DoM所涉及的屬性相關,重要的屬性被賦予一個4交高的^又值。我們可以通過統計一個屬性在各個web資料庫查詢接口上出現的頻率來評價它的重要性,頻率越高的屬性,我們認為它越重要。一種可行的權值計算方法是w,-J^,n表示屬性的總個數,》/*ifk是屬性Ak在當前領域的接口頻率值,即在當前領域各個web資料庫查詢接口上出現的總次數。那麼Confidence計算公式為Zwy*DoM(v,.,4)公式11formulaseeoriginaldocumentpage15其中Wj是M(Vi,Aj)中屬性Aj的權值。參考圖5,對根據本發明的查詢轉換模塊的方框圖進行說明。該查詢轉換模塊用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。如圖5所示,查詢轉換模塊包括計算匹配度模塊,用於初始化矩陣,計算每一個單元匹配的匹配度;分裂模塊,用於按數據類型分裂匹配度矩陣;行優化模塊,用於進行行優化;計算可信度模塊,用於計算候選查詢轉換解的可信度;排序模塊,用於對所計算的可信度按照由大至小的順序排序;獲得模塊,用於對排好序每一個候選查詢轉換解,如果它的可信度大於預先設定的閾值6,則輸出並獲得TopK解。下面結合圖6,對查詢轉換模塊的具體查詢轉換流程進行詳細的說明。步驟l(SI):計算匹配度矩陣。初始化矩陣,計算每一個單元匹配的匹配度。步驟2(S2):按數據類型分裂匹配度矩陣。如圖7所示,將各個關鍵詞單元和屬性預先按照數據類型分組,實現搜索空間的縮小。做法就是,將初始的匹配度矩陣按照數據類型分裂。具有相同數據類型的關鍵詞單元和屬性形成子矩陣。並在各個子矩陣上形成候選的單元匹配集合,從而減少候選的查詢轉換解的數目。數目變lgra剛化—Zl顛中l化/wformulaseeoriginaldocumentpage16步驟3(S3):行優化。行優化的基本的思想是由於生成查詢轉換解可以看作是在匹配度矩陣上對單元的選擇,如果可以預先確定一部分單元,那麼候選的查詢轉換解數目就會大大減少。如圖8所示,行優化分為兩種情況唯一值優化如果匹配度矩陣中存在一行,只有一個大於O的匹配度值,那麼這個單元所對應的匹配被確定,即最終的查詢轉換解中都應該包含這個匹配。並將這個單元所在的行從匹配度矩陣中移除。再重新掃描,如果還有符合行優化條件的行,則再次確定相應的單元,並移除其所在的行列。直到不再出現滿足條件的行為止。最優值優化矩陣上如果每行都有多於一個大於零的匹配度值,那麼考慮最優值優化。即在行中是否存在唯一的DM值為1的單元。因為DM值為1,表示在這個查詢條件單元在這個屬性的詞典中準確地出現。那麼這個查詢條件單元與這個屬性的匹配可以;陂確:〖人為最佳匹配。那麼它也可以被預先確定下來。步驟4(S4):計算查詢轉換解的可信度。計算候選查詢轉換解的可信度,並按照由大至小的順序排序。步驟5(S5):獲得TopK解。對排好序每一個候選查詢轉換解,如果它的可信,變《confidence)大於預先設定的閾值e,則輸出。獲得TopK解,其中K(預先定義的返回結果數)。從上述描述可知,由於其形式簡單,信息量少,智能接口背後的邏輯處理部分處理較為複雜是整個系統的關鍵。處理部分主要解決兩個難題正確地將用戶的查詢匹配到它所要查詢的領域;建立用戶填寫關鍵詞和其相關屬性之間的對應關係。因此,本發明具有以下優點1.接口界面簡單,具有獨立性智能接口只具有一個文本輸入框,非常簡單,使用時用戶不再需要為了瀏覽全部屬性而滾動網頁;無i侖底層在哪個領域上集成了新的Web資料庫,無論由此增加了怎樣的屬性及屬性候選值,頂層界面不需要做變更,減少了用戶對接口的學習過程。2.易用性強用戶的查詢不必受接口上屬性及屬性候選值在形式上的限制,能夠進行個性化的查詢。它能夠支持用戶輸入任意數據類型的屬性值,不僅可以是各類的文本1'直,還可以是悽史字,金、額,時間等。用戶可以在一個才匡中同時提交針對不同屬性的多個值作為查詢的約束條件。3.支持多領域查詢可以覆蓋多個領域。用戶不需要在從目錄頁面連結到指定的接口頁面,因為我們的系統能夠自動識別用戶的查詢意圖,將用戶的查詢匹配到最合適的領域上。在一個覆蓋了大量不同領域的電子商務網站中,自動實現領域匹配可以大大節省用戶的時間。從另一個角度來說,支持領域自動匹配的集成比原來的系統的集成度更高。4.提供對於非精確查詢的支持,查詢所能容納的邏輯更為靈活。不僅僅局限於"與"關係,還包含"或"關係。智能查詢4妄口與網站quicksearch^妄口的比專交外觀上,智能查詢接口與普通網站的quicksearch查詢^妄口十分相似,都是一個簡單的文本框。但在查詢能力上有很大差別。普通網站quicksearch只能對自身的資料庫內容進行查詢,智能查詢接口背後集成了多領域的多個資料庫,體現了web資料庫集成系統的優勢;另一方面,智能查詢接口支持混合數據類型的查詢條件;用戶可以提交的關鍵詞包括文本,數字,時間,金額等多種數據類型;此外,它允許更複雜的邏輯關係,靈活的查詢形式。整體上,智能查詢接'口屬於更高層次集成思想的一項技術創新,以豐富的信息和快速靈活的查詢為用戶帶來更多便利。對於本領域的普通技術人員來說可顯而易見的得出其他優點和修改。體說明及示例性實施例。因此,在不脫離由隨後權利要求及其等價體所定義的一般發明構思的精神和範圍的情況下,可對其做出各種修改。權利要求1、一種智能查詢接口系統,包括領域知識庫,用於存儲每個候選領域;智能查詢接口,用戶在該智能查詢接口上填寫查詢條件單元並將用戶的每個查詢分解為一組查詢條件單元;領域匹配模塊,用於根據存儲在領域知識庫中的信息計算出用戶查詢與每個候選領域的匹配度,並選出最相關的領域提供給用戶參考;以及查詢轉換模塊,用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。2、根據權利要求1的智能查詢接口系統,其中查詢條件單元包含的是在同一屬性上的一個或多個條件值,每個查詢條件單元內部都是"或"的關係。3、根據權利要求1的智能查詢接口系統,其中領域匹配模塊進一步包括分解模塊,用於分解用戶查詢;一次過濾模塊,當用戶查詢包含領域信息時,利用CT中的詞彙對查詢進行一次過濾,預先去除與查詢毫不相干的那些領域;過濾領域模塊,當預先確定了用戶輸入的某個詞是一個特殊的屬性名稱時,系統將自動將這個詞尾隨的符合該屬性數據類型的詞看作用戶在這個屬性上的條件值,並將二者看作一個統一的整體;計算模塊,用於計算相似度;排序模塊,用於根據領域與查詢的匹配度而對所有集成系統中的候選領域進行由高至低的排序;返回模塊,用於返回其中匹配度最高的k個領域。4、根據權利要求1的智能查詢接口系統,其中查詢轉換模塊進一步包括計算匹配度模塊,用於初始化矩陣,計算每一個單元匹配的匹配度;分裂模塊,用於按數據類型分裂匹配度矩陣;行優化模塊,用於進行行優化;計算可信度模塊,用於計算候選查詢轉換解的可信度;排序;f莫塊,用於對所計算的可信度^^安照由大至小的順序排序;獲得模塊,用於對排好序的每一個候選查詢轉換解,如果它的可信度大於預先設定的閾值e,則輸出並獲得TopK解。5、根據權利要求1的智能查詢接口系統,其中分裂模塊將初始的匹配度矩陣按照數據類型分裂,具有相同數據類型的關鍵詞單元和屬性形成子矩陣,並在各個子矩陣上形成候選的單元匹配集合。6、一種用在智能查詢接口系統上的方法,該智能查詢接口系統包括用於存儲每個候選領域的領域知識庫、智能查詢接口、領域匹配模塊、查詢轉換模塊,其特徵在於,該方法包括步驟接口輸入步驟,用戶在智能查詢接口上填寫查詢條件單元並將用戶的每個查詢分解為一組查詢條件單元;領域匹配步驟,用於根據存儲在領域知識庫中的信息計算出用戶查詢與每個候選領域的匹配度,並選出最相關的領域提供給用戶參考;以及查詢轉換步驟,用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。7、根據權利要求6的方法,其中查詢條件單元包含的是在同一屬性上的一個或多個條件值,每個查詢條件單元內部都是"或"的關係。8、根據權利要求6的方法,其中領域匹配步驟進一步包括分解步驟,用於分解用戶查詢;一次過濾步驟,當用戶查詢包含領域信息時,利用CT中的詞彙對查詢進行一次過濾,預先去除與查詢毫不相干的那些領域;過濾領域步驟,當預先確定了用戶輸入的某個詞是一個特殊的屬性名稱時,系統將自動將這個詞尾隨的符合該屬性數據類型的詞看作用戶在這個屬性上的條件值,並將二者看作一個統一的整體;計算步驟,用於計算相似度;排序步驟,用於根據領域與查詢的匹配度而對所有集成系統中的候選領域進行由高至低的排序;返回步驟,用於返回其中匹配度最高的k個領域。9、根據權利要求6的方法,其中查詢轉換步驟進一步包括計算匹配度步驟,用於初始化矩陣,計算每一個單元匹配的匹配度;分裂步驟,用於按數據類型分裂匹配度矩陣;行優化步驟,用於進行行優化;計算可信度步驟,用於計算候選查詢轉換解的可信度;排序步驟,用於對所計算的可信度按照由大至小的順序排序;獲得步驟,用於對排好序的每一個候選查詢轉換解,如果它的可信度大於預先設定的閾值6,則輸出並獲得TopK解。10、根據權利要求6的方法,其中分裂步驟將初始的匹配度矩陣按照數據類型分裂,具有相同數據類型的關鍵詞單元和屬性形成子矩陣,並在各個子矩陣上形成候選的單元匹配集合。全文摘要一種智能查詢接口系統及其方法,其中該系統包括領域知識庫,用於存儲每個候選領域的領域模型;智能查詢接口,用戶在該智能查詢接口上填寫查詢條件單元並將用戶的每個查詢分解為一組查詢條件單元;領域匹配模塊,用於根據存儲在領域知識庫中的信息計算出用戶查詢與每個候選領域的匹配度,並選出最相關的領域提供給用戶參考;以及查詢轉換模塊,用於建立用戶查詢條件單元與查詢接口屬性的對應關係,生成最後的查詢並送往相應領域的複雜集成接口。文檔編號G06F17/30GK101216853SQ20081005610公開日2008年7月9日申請日期2008年1月11日優先權日2008年1月11日發明者孟小峰,忺李申請人:孟小峰

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀