新四季網

一種多維檢索方法和裝置以及系統的製作方法

2023-06-03 02:39:36 2

專利名稱:一種多維檢索方法和裝置以及系統的製作方法
技術領域:
本發明涉及信息檢索領域,特別涉及一種多維檢索方法和裝置以及系統。
技術背景目前的搜索弓I擎通過對網際網路上海量信息進行收集整理,然後接受用戶的檢 索,並向用戶提供與檢索要素相關的結果,其主要過程包括數據的搜集過程、 預處理過程和提供服務的過程,現在的檢索主要是通過關鍵詞、關鍵字的匹配 來實現。用關鍵詞、關鍵字的匹配方法進行檢索的機器,它並不能理解用戶的 真實的檢索目的和意圖,機器只提供包含有關鍵詞、關鍵字的文檔,並不能提 供於用戶提供的檢索要素的目的或/和語義相同或相關的檢索結果。目前的搜索 引擎檢索結果的質量取決於對檢索要素設置的準確性,設置檢索要素對檢索質 量有著重大的影響,這取決於用戶對所要檢索信息的理解,確定合理的檢索策 略。但我們並不能要求每個用戶都是專家,現在的情況是往往用戶輸入一個檢 索詞,所得到的海量結果和我們想要達到的目的相去甚遠。 一方面由於搜索引 擎只對用戶提供的檢索詞,進行檢索,而無法對用戶提供的檢索要素的目的或/ 和語義相同或相關的檢索,使檢索的廣度和深度受到影響,另一方面搜尋引擎 又向用戶交付出海量的包含有用戶提供的關鍵詞的結果。這個海量的結果通常 超過幾萬個條目,裡面包含有大量的與用戶目的無關的文檔,用戶無法知道在 這幾萬個條目中哪個是對自己有用的。本公開是與我們在先公開《構建多維地址的方法、裝置以及系統》中國專利申請號是200710139245. 2的專利;以及《一種多維地址編址的方法和裝置以 及系統》中國專利申請號是200710139252. 2的專利;以及《一種多維超連結的 通訊方法和裝置以及系統》中國專利申請號是200710139315. 4的專利是相互交叉關聯的。《一種生成、部署和運行多維地址可擴展關聯標記語言的方法和裝置以及系統》中國專利申請號是200810054516. 9的專利;以及《一種智慧財產權保 護的方法和裝置以及系統》中國專利申請號是200710139620. 3的專利是相互交 叉關聯的。 發明內容本公開是創建一種多維檢索方法和裝置以及系統。所述的一種多維檢索方 法和裝置以及系統。是構建在我們在先發明的多維地址的基礎之上的。本公開 包括構建用多維地址規範構建的資源資料庫,在該資料庫中用多維地址標識資 源,用多維地址定義資源的屬性、邏輯結構和屬性的相互關聯,用多維地址建 立檢索要素(關鍵詞、關鍵字)與相關服務的關聯,用多維地址建立檢索要素 (關鍵詞、關鍵字)與相關語義的關聯。在該資料庫中包括資源和多維地址的 映射列表。在列表中包括語種表項,用該表項定義用多維地址所標識資源是何 種語言。用多維地址標識資源包括(關鍵字、關鍵詞、服務、語義等),通過多 維地址的相互關聯定義資源之間的相互關聯及空間結構,通過對多維地址的檢 索擴大檢索的範圍的廣度和深度。還包括構建多維地址規範索引資料庫,以多 維地址索引項來反映用多維地址標識數據的語義;用多維地址標識資源提供的 服務;用多維地址標識字;用多維地址標識詞;用多維地址標識短句等等。在 檢索過程中包括用多維地址的蘊涵或外延的層次級別確定數據資源的關聯值, 距離目標數據資源的層次越近其關聯值越高,匹配度越高;距離目標數據資源 的層次越遠其關聯值越低,匹配度越低用多維地址的序位定義數據資源的服務 偏好值。本發明的技術方案是創建一種多維檢索方法,包括搜集數據過程、對數 據進行預處理過程、用戶請求檢索過程、對用戶的査詢請求進行解析過程以及提供檢索結果的過程,包括在至少一個過程中用多維地址規範對數據進行處 理。本發明的另一方面是創建一種多維檢索的裝置,包括用於搜集數據的裝置、 用於對數據進行預處理的裝置、用於用戶請求檢索的裝置、用於對用戶的査詢 請求進行解析以及提供檢索結果的裝置,包括在至少一個裝置中包含有用於 多維地址規範對數據進行處理的裝置。本發明的另一方面是創建一種多維檢索的系統,包括用於搜集數據的系統、 用於對數據進行預處理的系統、用於用戶請求檢索的系統、用於對用戶的查詢 請求進行解析以及提供檢索結果的系統,該系統包括處理器可執行用於檢 索的實用程序;存儲裝置與處理器相連,存儲用於檢索的數據;接口用於 將檢索的系統連接於網絡;包括在至少一個系統中包含有用於多維地址規範對 數據進行處理的系統。 與現有技術相比本發明的有益效果是通過用多維地址建立檢索要素與相關服務的關聯、通過用多維地址建立檢 索要素與相關語義的關聯;提高檢索範圍的廣度和深度、提高返回給用戶的檢 索結果的準確度。本公開用多維地址表示所有數據,通過多維地址可以把網絡 中關聯的或不關聯的信息數據聯繫起來,如將日曆、旅館和某種計劃聯繫起來, 將一個街道和地圖聯繫等起來。諸如此類。通過本公開可以建立所有數據無縫 連接及檢索。


圖1示出的是本發明應用的一種網絡系統的高層的概念性圖解圖2示出的是本發明應用的公知的通用計算機環境圖3示出的是本發明應用的多維地址的格式圖4示出的是目前網絡中各種資源無規律表述狀態的示5示出的是本發明應用多維地址的結構的示6示出的是本發明的用多維地址標識資源的示7示出的是本發明的用多維地址空間結構表示資源的相互關聯的示8示出的是本發明的多維地址與資源映射列表圖9示出的是本發明的多維地址與服務映射列表、圖IO示出的是本發明的多維地址與字映射列表圖11示出的是本發明的多維地址與詞映射列表圖12示出的是本發明的多維地址與短句映射列表圖13示出的是本發明的多維地址與語義映射列表圖14示出的是本發明的搜尋引擎的示15示出的是本發明的多維檢索的步驟框16示出的是本發明的多維檢索的又一實施例步驟框圖具體實施方式
下面結合附圖與具體實施方式
對本發明進行進一步詳細描述本公開所述的網絡至少包括多維地址協議網絡,又稱為多維統一網,包括 用多維地址協議定義的物理網絡以及覆蓋在該物理網絡上的用多維地址及多維 地址協議定義的邏輯網絡。在本發明中圖1例示的是本公開的一種多維檢索方法和裝置以及系統的使 用環境,是多維地址協議網絡系統我們稱這種網絡為多維統一網系統,100示出 的是該網絡的高層的概念性圖解,作為例子該網絡包括但不限於用多維地址協 議定義、進行控數據傳輸及控制,網絡中的各種資源作為例子包括但不限於用多維地址進行標識、定位;圖中的101、 102、 103、 104、 105、 106均為以多維 地址標識的資源,作為例子包括但不限於使用或/和遵循多維地址協議規範,其 中101為傳輸介質,102通常為多維統一網高速路由器,103為多維統一網接入 節點其通常也是路由器,其用多維地址協議在102多維統一網高速路由器和其 它網絡之間路由數據分組,多維統一網節點103連接有多個多維統一網高速路 由器102以提供一定的冗餘,104、 105、 106均為以多維地址標識的資源,其 中105是104的下級別多維地址標識的資源,106是105的下級別多維地址標識 的資源,各級別資源的級別是邏輯上的上下級關係,其可能位於不同的網絡並 通過不同的接入節點103進行數據傳輸,或直接連接102多維統一網高速路由 器進行數據分組傳輸,所述下級別的多維地址來源於上級別多維地址標識的資 源的分配或來源於多維地址管理資源的分配或第三方資源的分配,多個資源通 過多維地址的相互關聯構成一個多維虛擬網絡,各資源維護其關聯資源的路由 表。多維統一網可以包含有各種拓撲結構的網絡,其可以通過增加新的資源, 諸如結點、鏈路進行無限的擴展,在本發明中的所述的資源是指所有能夠通 過多維統一網使用的實體,其包括物理資源、邏輯資源、可移動資源、不可 移動資源,作為例子包括但不限於,諸如節點、連接到網絡的接口、計算機群、並行計算機、計算機池、大型資料庫、多處理器系統、基於微處理器的系 統、可嵌入計算機、個人計算機、手持或膝上型可攜式設備、可編程消費電子 產品、基於光交換技術的高速交換設備、各種計算機功能部件的集合體、主幹 網中的管理資源、高速路由器、主幹網的接入接點、(路由器)、網關、交換機、域名伺服器、通訊設備、精密儀器、傳感器、存儲器、CPU、 ROM、 RAM、 CPU群 集合體、DRAM群集合體、輸入/輸出接口、計算機軟體包括系統軟體、應用軟體、 應用程式、文件、數據實例、數據、元素、信息、電子貨幣、虛擬人、虛擬動物、虛擬植物、虛擬地球、虛擬城市、虛擬物體,文本文件、音頻文件/視頻文 件、數據、數據實例的數據文件等等。所述多維統一網還包括由其中的邏輯 資源構成的多維虛擬網,多維統一網中主幹網部分包含有多個多維統一網高速 路由器,這些多維統一網高速路由器接收數據分組,並向網絡中的其它節點傳 遞這些數據分組,每個多維統一網高速路由器具有多個到其它多維統一網高速 路由器和/或網際網路高速路由器的連接並且這些連接具有高數據容量,多維統一 網中的資源依靠多維地址協議完成數據通訊,資源中駐留有多維地址協議的其 中一個或多個協議軟體模塊。所示多維統一網100是用通信(傳輸)介質101以及圖中未示出的接口將資源,102、 103、 104、 105、 106,可通訊的連接起來 並依靠多維地址協議實現數據的傳輸及應用,圖1中100多維統一網系統中的 各資源之間的連接可以是任何拓撲結構的連接,包括可以是總線形拓撲結構, 環形拓撲結構,星形拓撲結構和這些形狀混合構成的混合拓撲結構,以及其它 形狀的拓撲結構,其總體結構可以通過增加新節點和鏈路獲得無限擴展,其中 每個資源節點可以具有多個將其連接到其它資源節點的鏈路。這些實現多維統 一網各系統的物理基礎網絡即是以通信介質101構成的使數字設備(節點)相 互之間具有多個鏈路進行連接的異構的網絡,這些異構的網絡包括乙太網、 區域網(LAN)、廣域網(WAN)、城域網(MAN)、 Local Talk 、 X , 25 、令牌 環區域網,數字數據網(DDN)綜合業務數字網(ISDN)、全光網、基於先進的 交換和光纖傳輸技術即ATM和SONET的超高帶寬網絡服務(vBNS)、 ATM、 SDH/S0NET、基于波分多路復用WDM的光傳輸技術的傳輸系統、WDM、 DWDM、以 光交叉連接0XC/光分插復用OADM設備為主體的光交換系統、3T (Tb/s傳輸、 Tb/s交換、Tb/s路由)光網絡、混合光纖同軸電纜網HFC、非對稱數字用戶線 ADSL、 WLAN、 LMDS (本地多點分配業務)、GSM 、 GPRS或、3G 、 HiperLAN 、HomeRF 、藍牙、IR (紅外)、UWB (超寬帶)、JTRs (聯合戰術無線電系 統)、3G (第三代移動通信)、WiMAX、 GPRS (通用分組無線電業務)或EDGE(全球演進的增強型數據速率)中的無線電標準等等其它網絡及其通信介質。 多維統一網系統100可以與網際網路(網際網路)電視網,通信網等相互共用其由 通信介質構成的網絡,在多維統一網系統中,網際網路,全球資訊網,電視網,通信 網以及各種專用網及其資源也可以成為資源,即通過一種設備裝置或/和軟體(多維地址協議)可以是網際網路,全球資訊網,電視網,通信網及各種專用網包括 上述各網的資源,成為一種資源。通過此種設備裝置或/和軟體(多維地址協議) 也可以使多維統一網系統的資源成為基於IPV4, IPV6, IPV9地址的系統的資源, 此種設備,裝置或/和軟體包含有多維地址協議,通過多維地址協議的諸如多 維地址配置、標識、路由、管理、控制等實現上述功能,這也是我們發明的一 種實施例,其也是一種多維統一網服務管理裝置。圖1所示多維統一網系統100中的資源,103、 104、 105、 106也可以是區 域的多維統一網服務管理裝置、通訊設備或/和路由器、區域(本地)域名服務 器、交換機、智能集線器等多維統一網服務管理資源。雖然圖1中所示出了各 資源102、 103、 104、 105、 106及通信介質101,但應當理解這些資源的實際數 量和類型可以有所不同,其實際數量可以遠大於圖1中所示出的數量。在本發 明中,在多維統一網絡的主幹部分分布有大量的專用局域多維統一網服務管理 裝置(多維統一網路由資源多維統一網/網際網路路由資源),這些專用的多維統 一網服務管理裝置(多維統一網路由器、多維統一網/網際網路路由器)具有兩個 或兩個以上的多維統一網、網際網路(含乙太網)網絡接口用於連接不同的網絡, 其協議至少實現到多維統一網多維地址協議,諸如多維地址協議中的各種協 議包括、,理解多維地址協議、IPV4、 IPV6、 IPV9等協議,可進行多維統一網/網絡層通信,支持兩種以上的子網協議(異種網),可進行存儲、轉發、尋徑、 並具有一組路由協議。專用的多維統一網服務管理裝置(多維統一網路由器、 多維統一網/網際網路路由器),其用於連接多個邏輯上分開的多維統一網網絡和/ 或網際網路網絡。當數據從一個子網傳輸到另一個子網時可通過專用的多維統一 網服務管理裝置(多維統一網路由器、多維統一網/網際網路路由器)來實現。專 用的多維統一網服務管理裝置(多維統一網路由器、多維統一網/網際網路路由器),可以判斷多維地址、IP位址(包括IPV4、 IPV6、 IPV9地址)和選擇路徑、 以及在多維統一網、以及網際網路的網絡互聯環境中建立靈活有效的連接,可完 成不同數據分組和介質的訪問方法,去連接各種子網,這些專用的多維統一網 服務管理裝置(多維統一網路由器、多維統一網/網際網路路由器)接收數據分組, 並向多維統一網、網際網路中其它節電傳遞這些數據,其任何單獨的專用多維統 一網服務管理裝置(多維統一網路由器多維統一網/網際網路路由器)可以不必知 道所有的多維統一網或/和網際網路的最終目的地。傳遞遠程地址的數據分組會被 路由到最近的專用多維統一網服務管理裝置(多維統一網路由器、多維統一網/ 網際網路路由器)能夠進一步細化地址,諸如此類,直到數據分組到達其最終目 的地。通常每個專用多維統一網服務管理裝置(多維統一網路由器、多維統一 網/網際網路路由器)具有多個到其它專用多維統一網服務管理裝置的連接,並且 這些連接具有高數據容量,其通常使用光纖鏈路。圖1例示中的101是通信介質,其可以是有線介質或無線介質,它們包括但 不限於銅導線、同軸電纜、光纜、無線電波、微波、FR (射頻)紅外線、聲音 等對本發明而言,圖1中的資源102、 103、 104、 105、 106可使用任意公知的 技術來實現。例如可以使用硬體邏輯組件來實現,如一個或多個ASIC (特定應 用的集成電路),或者它可以作為一個或多個處理器執行的一組指令以軟體的形式來實現。所述軟體包括但不限於程序模塊以及實現本發明的特定抽象數據類 型的例程、程序、組件數據結構等,它們在多維統一網計算環境中通常位於本 地、遠程資源和多維服務管理裝置以及包括存儲器設備在內的計算機存儲介質中。圖2示出的是200形式的公知的通用計算機環境,該計算機包含但不限於 本發明的計算環境。在圖2中其210處理器CPU在各種存儲單元,如221隻讀 存儲器ROM、 222隨機存取存儲器RAM和高速緩存的支持下運行與多維地址協議 相關的軟體,包括諸如包含有生成、或/和識別、或/和應用多維地址協議和 關於本公開的多維檢索系統軟體,即關於多維地址協議和關於本公開的多維檢 索系統軟體,但不限於關於多維地址協議和關於本公開的多維檢索系統的軟體。 關於多維地址協議和關於本公開的多維檢索系統的軟體或/和其它軟體存儲在 ROM中,稱為ROM映像,這個映像中包括,但不限於,關於多維地址協議和關於 本公開的多維檢索系統軟體、還包括其它軟體的引導程序、初始化數據、初始 屏幕顯示或者系統狀態的字符串、系統執行的多任務程序以及實時作業系統(RTOS)內核。ROM中存儲的ROM映像包含最終設計的代碼。RAM存儲的包括, 但不限於,關於多維地址協議和關於本公開的多維檢索系統的軟體、還包括其 它軟體的程序執行過程中變量和堆棧的臨時值。高速緩存提前存儲來自於外部 存儲器的指令和數據副本,並在快速處理過程中臨時存儲結果。關於多維地址 協議和關於本公開的多維檢索的軟體通常嵌入在只讀存儲器(ROM)中。圖2 中的220是用於存儲信息和處理器所執行的指令的與總線230相互連接的存儲 器,它是用於存儲數據和程序的隨機訪問半導體存儲器,它可以用以存儲關於 多維地址協議和關於本公開的多維檢索系統但不限於此系統的數據和程序以及 臨時變量或其它中間信息,存儲器220,包括易失性和/或非易失性存儲器形 式的計算機存儲介質,諸如221隻讀存儲器ROM和222隨機存取存儲器RAM, ROM中一般存儲關於多維地址協議和關於本公開的多維檢索系統但不限於多維地址協議和關於本公開的多維檢索系統的系統啟動程序和參數表,也用來存放RAM 中一般存儲包括數據和/或程序模塊,可由處理單元210立即訪問和/或當即操 作。常駐內存的監控程序或者作業系統的常駐內存部分,甚至也可用來存放字 庫或者某些語言的編譯程序及解釋程序。在圖2中示出的220是概念性的存儲 器,但是應當理解存儲器220經常被組織成為高速緩存層次結構的具有高速緩 存存儲器(cache)的存儲器或其它存儲設備。CPU210是與系統總線相連接的執 行存儲器220中存儲的指令的通用可編程處理器即是一個集中取指和處理一組 通用指令的單元,其可以取指和控制一個給定命令或指令的順序執行,並與系 統的其餘部分進行通訊,以及進行對字節或字的算術和邏輯操作。圖2中示出 的是單獨的CPU然而應當理解資源包括多維統一網服務管理裝置(伺服器)、 請求資源(客戶)、調用資源(第三方資源)它們可以是具有多個CPU的計算系 統。圖2中示例的資源(裝置)中還包括將存儲器220在內的各種計算機組 件和/或功能單元連接到CPU 210和使功能單元和/或組件之間相互連接的系統 總線230,系統總線230可以是任何幾種類型的總線結構,包括有存儲器總 線、使用任何各種各樣總線結構的局部總線、作為例子,但不限於,這樣的總 線結構工業標準總線(ISA)、微通道總線(MCA)、擴充的工業標準總線(EISA)、 局部總線(PCI)、 AGP總線、通用串行總線(USB)視頻電子標準協會局部總線(VESA)、基於光波導的短距離光互聯總線、在可嵌入式計算機中應用的I 2C 總線、CAN總線、先進的串行高速總線、PCI-X (擴展PCI)總線、CompactPCI 總線(cPCI)、 PXI總線、IEEE1394總線、UART總線、以及CoreConnect總線標 準、AMBA總線標準、Wishbone總線標準、AHB總線、ASB總線、APB總線等等。 圖2、中例示的資源(裝置)200、中還包括其它的易失性的/非易失性的、可移動的/不可移動的計算機存儲介質。圖2、示出的計算機200中例示了可讀寫不 可移動的非易失性的磁介質的旋轉磁性硬碟驅動單元241其通過不可移動的非 易失性存儲器接口 240連接到系統總線230 。 200中還包括:磁碟驅動器251、 光碟驅動器252、其通過可移動的非易失性存儲器接口 250連接至系統總線230, 磁碟驅動器251、光碟驅動器252可分別裝入使用諸如讀寫可移動的非易失性 磁碟、讀寫可移動的非易失性光碟,可以在示例的資源(裝置)環境中使用其 它的可移動的/不可移動的、易失性的/非易失性的計算機存儲介質,其還包括, 但不限於磁帶、磁帶存儲器、快閃記憶體、數字通用盤、數字視頻帶、移動存 儲設備、硬碟驅動器、U盤、移動硬碟、固態ROM、固態MM等等。上述的驅動 單元241、 251、 252及其相關的計算機存儲介質,是用於存儲關於多維地址協 議和本公開多維檢索系統的但不限於該系統的計算機可讀指令、數據結構、程 序模塊、數據實例或其它數據。圖2中示出的201是終端接口,其可以通過任 意的方式或為單個或多個終端提供連接,連接到系統總線230 。應當理解,其 通常通過在一個或多個電子電路卡上的終端接口 I/O處理器支持多個終端的直 接連接附接,包括終端可通過區域網路連接到終端接口 201也可以是其它方式。 圖2中示出的與系統總線230連接的202例示的是應用多維地址協議和關 於本公開的多維檢索系統的網絡和/或網際網路接口 ,它是針對應用多維地址的網絡和/或網際網路260的數據傳輸提供物理的連接,可通過多維統一網/網際網路接 口 202發送消息並接收數據,包括程序代碼。圖2中200形式的公知的通用計 算機,示例圖中各單元組件及其組合併不是想要對任何關於本發明的用途或功 能範圍進行任何的限制,也不應該將所例示的各種環境中的單元、組建的一個 或組合解釋為具有相關的依賴性要求,其單元組件在不影響本發明的實質的情 況下可進行任意的增加和/或組合其它未示出的單元、組件,也可以縮減所例示出的單元、組件或/和組合,任何不影響本發明實質的改變都應是視作本發明的 等同物範圍。圖3示出的是多維地址的格式301是多維地址的信息維部,302是多維地址 的空間結構部。在多維地址的信息維中以特定的位和值定義多維地址所標識的 資源,諸如定義多維地址是用於標識語義;或是用於標識服務;或是用於標識 字;或是用於標識詞;或是用於標識短句等等。用多維地址空間結構部302定 義多維地址所標識資源的相互關聯。還包括用多維地址邏輯結構和關聯關係定 義數據資源的蘊涵;用多維地址定義數據資源的外延;用多維地址的蘊涵或外 延的層次級別確定數據資源的關聯值,距離目標數據資源的層次越近其關聯值 越高,匹配度越高;距離目標數據資源的層次越遠其關聯值越低,匹配度越低 用多維地址的序位定義數據資源的服務偏好值。圖4示出的是目前網絡中各種資源無規律表述狀態示圖,該示圖中的各種 資源雖然都有各自唯一的標識,但我們無法通過其標識得到其相互關聯的解讀。 其原因是標識符1至10標識符沒有定義其相互關聯。可以將圖4中示出的資源 1至資源10可以理解為是不同的關鍵詞、或將圖4中示出的資源1至資源10可 以理解各種語義的詞、或將圖4中示出的資源1至資源10可以理解為是各種資 源提供的服務。圖5示出的是多維地址的結構,在該示圖中可以看出多維地址相互之間具 有的關聯關係。圖6示出的是用多維地址標識資源的示圖,用多維地址標識資源,通過多 維地址的相互關聯定義資源1至資源10之間的相互關聯及空間結構。圖7示出的是用多維地址空間結構表示資源的相互關聯的示圖,在本示例 中示出的是用多維地址定義動植物的分類關係,應當理解多維地址可以表示任何的資源。在本示例中是用多維地址的從高級別到底級別的關係依次定義動植 物的分類關係諸如門、綱、目、科、屬、種,即通過多維地址就可以確定用 多維地址所標識的資源的屬性,門、綱、目、科、屬、種,得到和其它資源之 間的關係圖。本公開包括構建用多維地址規範構建的資源資料庫,該資料庫中 包括資源和多維地址的映射列表。在列表中包括語種表項,用該表項定義用多 維地址所標識資源是何種語言。圖8示出的是多維地址與資源映射列表、該表包括列表名稱、多維地址表 項和多維地址所對應的資源表項、語種表項1至語種表項N。圖9示出的是多維地址與服務映射列表、該表包括列表名稱、多維地址表 項和多維地址所對應的服務表項、語種表項1至語種表項N。圖IO示出的是多維地址與字映射列表、該表包括列表名稱、多維地址表項 和多維地址所對應的字表項、語種表項1至語種表項N。圖ll示出的是多維地址與詞映射列表、該表包括列表名稱、多維地址表項 和多維地址所對應的詞表項、語種表項1至語種表項N。圖12示出的是多維地址與短句映射列表、該表包括列表名稱、多維地址表 項和多維地址所對應的短句表項、語種表項1至語種表項N。圖13示出的是多維地址與語義映射列表、該表包括列表名稱、多維地址表 項和多維地址所對應的語義表項、語種表項1至語種表項N。本公開的一種多維檢索方法中包括搜集數據的過程、對數據進行預處理的過 程、用戶請求檢索的過程、對用戶的查詢請求進行解析的過程以及提供檢索結 果的過程,或還包括通過搜尋引擎甄別權利數據信息並處理權利數據的過程;,本公開包括在上述至少一個過程中用多維地址規範對數據進行處理。 所述處理包括用多維地址的屬性和數據的屬性關聯,用多維地址的相互關聯定義數據之間的相互關聯;在所述一個或多個過程中用多維地址規範對數據進行 處理;包括構建多維地址規範資源資料庫,即用多維地址標識資料庫中的數 源資源;所述資料庫包括位於請求端或伺服器端;本公開所述的多維地址規範資源資料庫包括建立多維地址規範資源可擴展關聯 資料庫,所述多維地址規範資源可擴展關聯資料庫,是指在該資料庫中用多維 地址標識資源,用多維地址定義資源的屬性、邏輯結構和屬性相互關聯,用多 維地址建立檢索要素(關鍵詞、關鍵字)與相關服務的關聯,用多維地址建立 檢索要素(關鍵詞、關鍵字)與相關語義的關聯。所述建立多維地址規範資源可擴展關聯資料庫,包括建立資源的可擴展關聯語 義資料庫,所述多維地址規範資源的可擴展關聯語義資料庫是指在該資料庫中 包括用多維地址標識資源的語義,用多維地址定義資源語義的屬性、邏輯結構 和屬性相互關聯。還包括建立資源服務的可擴展關聯服務資料庫,所述資源服 務的可擴展關聯服務資料庫是指在該資料庫中包括用多維地址標識資源提供的 服務,用多維地址定義資源服務的屬性、邏輯結構和屬性相互關聯。還包括用 多維地址建立檢索要素(關鍵詞、關鍵字)與相關服務的關聯的資料庫,用多 維地址建立檢索要素(關鍵詞、關鍵字)與相關語義的關聯的資料庫。圖14示出的是搜尋引擎的示圖,該搜尋引擎1400通過搜索器1402在網絡 1401中漫遊,發現和搜集信息,包括從一個起始的多維地址集合開始依據多 維地址的邏輯關聯,以寬度優先或深度優先或啟發式方式循環的在網絡中搜集 信息。還包括從一個起始的多維統一資源定位器集合開始順著超連結以寬度優 先或深度優先或啟發式方式循環的在網絡中搜集信息。還包括從一個起始的統 一資源定位器(URL)以寬度優先或深度優先或啟發式方式循環的在網絡中搜集 信息。所述網絡1401包括多維地址協議網(多維統一網)、網際網路等。用控制器1403控制搜索器在單位時間內對一個網站抓取的數量、控制處於分布狀態的 搜索器協調工作、包括控制分布的信息獲取和計算以及對其進行的數據統一、 控制網頁的重複抓取、控制分布狀態資料庫1405的數據存儲、包括數據處理後 的分布存儲和管理,包括資源的定位、更新、增加、刪除以及移動機制,還包 括控制處理大規模並發請求時的分發機制。1404多維地址規範處理模塊;對搜 索器抓取的資源進行處理,用多維地址規範對預先搜集的數據進行數據預處理; 包括包括用多維地址的屬性和數據的屬性相關聯,用多維地址的相互關聯定 義數據之間的相互關聯;用多維地址建立檢索要素(關鍵詞、關鍵字等)與相 關服務的關聯,用多維地址建立檢索要素(關鍵詞、關鍵字等)與相關語義的 關聯,諸如用多維地址標識數據的語義;用多維地址標識資源提供的服務; 用多維地址標識字;用多維地址標識詞;用多維地址標識短句等等。用資料庫 1405存儲壓縮的用搜集器抓取來的網頁,包括原始資料庫和用多維規範進行處理後的資源資料庫;所述資料庫包括多種語言的資料庫諸如漢文(包括簡體和繁體)、英文、日文、法文、德文、西班牙文、義大利文、希伯來文、葡萄牙 文、俄文、朝鮮文、阿拉伯文等世界各國的文字語言的資料庫,還包括藏文、蒙文、維吾爾文等民族語言資料庫。索引系統1406包括索引器、多維地址規範索引資料庫、原始數據索引資料庫、索引器的功能是理解搜索器所搜索的信 息,從中抽取出包含有多維地址的索引項,用於表示文檔以及生成文檔庫的索 引表。所述索引項包括有多維地址索引、客觀索引項和內容索引等。多維地址索引項是用來反映用多維地址標識數據的語義;用多維地址標識資源提供的服 務;用多維地址標識字;用多維地址標識詞;用多維地址標識短句等等。所述 客觀索引項包括反映與文檔的語意內容無關,如作者名、URL、權利信息、更新 時間、編碼、長度、連結流行度等等。所述內容索引項包括用來反映文檔內容,如關鍵詞及其權重、短語、單字等等。所述內容索引項和多維地址索引可以分 為單索引項和多索引項或稱短語索引項,所述單索引項就是各種語彙的單詞或 切分詞語,或多維地址標識的各種語彙的單詞或切分詞語。包括給單索引項 賦予一個權值,以表示該索引項對文檔的區分度,同時用來計算查詢結果的相 關度。包括用統計法、資訊理論法和概率法,短語索引項的提取方法有統計法、 概率法、和語言學法。構建的索引表一般使用某種形式的倒排表(inversion list),即由索引項査找相應的文檔。索引表還包括記錄索引項在文檔中出現的 位置,使檢索器用於計算索引項之間的相鄰或接近關係(proximity)。所述索 引器包括使用集中式索引算法或分布式索引算法,包括進行即時索引(instant indexing)。索引器索引的資源包括索引網頁、索引各種媒體,包括文字、動畫、 音頻、視頻、服務及其他特殊資源(如PDF、 XML等)。多維地址規範索引資料庫,是存儲用多維地址索引的相關信息的資料庫。 原始數據索引資料庫,是存儲用關鍵詞、字、權重等索引的相關信息的資料庫。用戶接口 1408是接受用戶1407所輸入的查詢要素,如查詢字、詞、查詢 的服務、短語等,接口還向用戶1407顯示查詢的結果在顯示結果的同時還向用 戶顯示用多維地址規範處理的與用戶所輸入的檢索要素相關的服務或/和語義 列表或結構樹,使用戶可選擇更準確的檢索要素,以得到更精確的檢索範圍, 使檢索的結果與檢索目的密切相關。搜尋引擎還包括建立用戶行為日誌資料庫 1409用於存儲和記錄用戶的查詢日誌和點擊日誌,記錄査詢/點擊的時間、查詢 /點擊要素等用戶信息,査詢要素包括,諸如提交時間、用戶多維地址、頁 號、查詢字、查詢詞、査詢的服務、查詢短語等;點擊要素包括點擊時間、 用戶多維地址、點擊要素、點擊的多維統一資源定位器、URL、權利信息、點擊 頁面的排序等等。通過日誌分析器1410對用戶的査詢行為/點擊行為進行統計和分析,包括用戶查詢要素的分布情況、雷同查詢要素的衰減統計、相鄰N 項査詢項的偏差分析、用戶點擊多維地址、多維統一資源定位器、URL的分布情 況、用戶在輸出結果中的翻頁情況、是否在高速緩存中等。檢索器1411用於根 據用戶的査詢條件在索引庫1406中檢索出相關文檔,包括通過特定的檢索模 型對文檔與查詢的要素進行相關度的評價以及對所要輸出的結果排序,所述檢 索模型包括,諸如集合理論模型、代數模型、概率模型、混合模型。檢索器 包括對用戶的檢索條件多維地址規範處理模塊1412,用於對用戶輸入的檢索要素進行多維地址規範處理,用多維地址規範對用戶提交的査詢數據進行數據處理,包括包括用多維地址的屬性和檢索要素數據的屬性相關聯,用多維地址 的相互關聯定義數據之間的相互關聯;用多維地址建立檢索要素(關鍵詞、關 鍵字)與相關服務的關聯,用多維地址建立檢索要素(關鍵詞、關鍵字)與相 關語義的關聯,諸如用多維地址標識數據的語義;用多維地址標識資源提供 的服務;用多維地址標識字;用多維地址標識詞;用多維地址標識短句等等, 以實現用多維地址進行數據檢索。圖15示出的是本公開的多維檢索的步驟的實施例包括步驟1500開始; 1501、用戶輸入檢索要素、1502接受用戶提交的査詢元素;1503將用戶提交的 査詢元素與資料庫中的數據元素進行匹配;1504將査詢元素解析為多維地址; 1505用多維地址定義的屬性、關聯關係確定查詢元素的匹配信息;1506返回一 個和用戶查詢匹配的信息列表;所述列表中的每一個條目包括明示的權利信 息部分;標題部分;網址連接部分,包括經過綁定的數據的訪問地址和服務統 計地址部分通過該部分使用戶在點擊權利數據的訪問地址(URL、多維URL等) 訪問該權利數據時,還建立與第三資源的連接,使第三資源通過該連接獲得提 供該連結信息的搜尋引擎的地址信息,或還包括用戶訪問權力數據的時間信息;數據內容的摘要部分;所述條目的排序要素包括匹配度、時間、競價,還包括向用戶顯示用多維地址規範處理的與用戶所輸入的檢索要素相關的服務或/和語義列表或結構樹或分布圖,使用戶可選擇更準確的檢索要素;1507用戶確 定是否用新的檢索要素進行檢索,如果不需要進入步驟1508結束。如果步驟 1507確定用新的檢索要素進行檢索,以得到更精確的檢索範圍;步驟1509用戶 確定新的檢索要素點擊、跳至步驟1502圖16示出的是本公開的多維檢索的步驟的又一實施例包括步驟1600開始; 1601、用戶輸入檢索要素1602接受用戶提交的査詢元素;1603將用戶提交的査 詢元素與資料庫中的數據元素進行匹配;1604將查詢元素解析為多維地址;1605 用多維地址定義的屬性、關聯關係確定查詢元素的匹配信息;1606從資料庫中 檢索與搜索信息對應的資源,並獲取該資源的多維地址,1607根據多維地址的 相互關聯確定搜索資源的關聯資源;1608將資源及其關聯資源信息在搜索服務 器的資源資料庫中進行匹配,1609將匹配得到的即時結果返回用戶本地程序或 腳本程序包括返回一個和用戶查詢匹配的信息列表;所述列表中的每一個條目 包括明示的權利信息部分;標題部分;網址連接部分,包括經過綁定的數據 的訪問地址和服務統計地址部分通過該部分使用戶在點擊權利數據的訪問地 址(URL、多維URL等)訪問該權利數據時,還建立與第三資源的連接,使第三 資源通過該連接獲得提供該連結信息的搜尋引擎的地址信息,或還包括用戶訪 問權力數據的時間信息;數據內容的摘要部分;所述條目的排序要素包括匹 配度、時間、競價。在當前的搜索頁面上的第一顯示欄中顯示所搜索資源的直 接結果;第二顯示欄中顯示所搜索資源的關聯結果;還包括向用戶顯示用多維地址規範處理的與用戶所輸入的檢索要素相關的服務或/和語義列表或結構樹或分布圖,使用戶可選擇更準確的檢索要素;1610用戶確定是否用新的檢索要素進行檢索,如果不需要進入步驟1611結束。如果步驟1509確定用新的檢索 要素進行檢索,以得到更精確的檢索範圍;步驟1612用戶確定新的檢索要素點 擊、跳至步驟1602上述所有實施例的描述中示出的是作為本發明的較佳實施例,本發明還可 以有其它的實施例,即在不脫離本發明範圍的情況下可進行修改,應當理解這裡公開的是優選的實施例,上述的方法步驟中,可以存在除了這裡所例示的以 外還可以有許多變化,具體的應當理解到,可以改變執行某些步驟的順序,某 些步驟是可選的,或者可以按照與這裡描述的不同的方式被執行,並且某些步 驟可以被組合。應當理解各實施例只是示範性的不應當作為對我們發明範圍的 限制,而是應視為凡是落入權利要求範圍和其等同物的範圍和精神內的所有實 施例都是我們的發明。
權利要求
1一種多維檢索方法,包括搜集數據過程、對數據進行預處理過程、用戶請求檢索過程、對用戶的查詢請求進行解析過程以及提供檢索結果的過程,其特徵在於,包括在至少一個過程中用多維地址規範對數據進行處理。
2.如權利要求1所述的一種多維檢索方法,其特徵在於,所述在至少一個過程中用多維地址規範對數據進行處理;包括用多維地址的屬性和數據的屬性相 關聯,用多維地址的相互關聯定義數據之間的相互關聯;包括用多維地址建立檢索要素與相關服務的關聯;用多維地址建立檢索要素與相關語義的關聯。
3.如權利要求2所述的一種多維檢索方法,其特徵在於,在所述一個或多個 過程中用多維地址規範對數據進行處理;包括構建多維地址規範資源資料庫, 用多維地址標識資料庫中的數源資源;所述資料庫包括位於請求端或伺服器端。
4.如權利要求1所述的一種多維檢索方法,其特徵在於,所述用多維地址規 範對數據進行處理;包括用多維地址規範對預先搜集的數據進行數據預處理;或用多維地址規範對用戶提交的査詢數據進行數據處理。
5.如權利要求1所述的一種多維檢索方法,其特徵在於,所述用多維地址規 範對數據進行處理;包括-接受用戶提交的査詢元素;-將用戶提交的查詢元素與資料庫中的數據元素進行匹配; -將查詢元素解析為多維地址;-用多維地址定義的屬性、關聯關係確定査詢元素的匹配信息; -返回一個和用戶査詢匹配的信息列表;所述列表中的每一個條目包括標題、網址連結、摘要、權利信息部分; 所述條目的排序要素包括匹配度、時間、競價。
6.如權利要求5所述的一種多維檢索方法,其特徵在於,所述將用戶提交 的査詢元素與資料庫中的數據元素進行匹配;包括對標識資源的多維地址匹配、關鍵字匹配、關鍵詞匹配、服務匹配、語義 匹配;
7.—種多維檢索的裝置,包括用於搜集數據的裝置、用於對數據進行預處理 的裝置、用於用戶請求檢索的裝置、用於對用戶的査詢請求進行解析過程以及 提供檢索結果的裝置,其特徵在於,包括在至少一個裝置中包含有用於多維 地址規範對數據進行處理的裝置。
8. —種多維檢索的系統,包括用於搜集數據的系統、用於對數據進行預處理 的系統、用於用戶請求檢索的系統、用於對用戶的査詢請求進行解析的以及提 供檢索結果的系統,其特徵在於該系統包括處理器可執行用於檢索的實用程序;存儲裝置與處理器相連,存儲用於檢索的數據;接口用於將檢索的系統連接於網絡;包括在至少一個系統中包含有用於多維地址規範對數據進行處理的系統。
全文摘要
本公開創建了一種多維檢索方法和裝置以及系統,包括搜集數據、對數據進行預處理、用戶請求檢索、對用戶的查詢請求進行解析以及提供檢索結果的過程,包括在至少一個過程中用多維地址規範對數據進行處理。
文檔編號G06F17/30GK101241506SQ200810054629
公開日2008年8月13日 申請日期2008年3月17日 優先權日2008年3月17日
發明者張建中 申請人:張建中

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀