概念網絡的製作方法
2023-05-08 18:55:01 1
專利名稱::概念網絡的製作方法
技術領域:
:本發明涉及搜索工具,尤其涉及所顯示的搜索結果。發明背景隨著諸如網際網路等網絡的迅速增長,搜索的準確性和質量變得越來越重要。但是,許多用戶發現使用搜尋引擎的搜索產生大量(可能數以千計)的結果,其中許多並不嚴密地適用於他們所提交的查詢。由此,許多用戶對搜索結果不滿意。一些用戶還發現,大量返回的査詢結果使網際網路中包含的重要信息變得模糊不清。許多現有技術的搜尋引擎主要是基於關鍵詞的比較。考慮詢問世界上最頂尖的N個數碼攝像機製造商的査詢,其中N是整數。關鍵詞比較搜尋引擎將返回一些包含關鍵項"數字攝像機"的全球資訊網頁,以及其它包含關鍵項"製造商"的全球資訊網頁。因此,在關鍵詞比較搜尋引擎中返回的涉及數碼攝像機製造商的總的返回結果的百分比相對很小。關鍵詞比較搜尋引擎還無法基於製造商的全球資訊網頁來比較一特定數碼攝像機製造商是否比另一數碼攝像機製造商更大或更有名(或其它某個可量化的比較)。因此,主要基於關鍵詞比較的現有技術的搜尋引擎常常導致大量結果,而其中許多與査詢的相關度很低。此類關鍵詞比較搜尋引擎不能基於全球資訊網站的結構來標識多個搜索所得的全球資訊網站中最適用的那些。在另一個方面,許多用戶相信他們必須搜索大量査詢以獲得有用的搜索結果。因此,這些用戶相信査詢(以及就相關性對搜索結果所進行的檢査)需要大量時間以確保所有有關響應都被考慮。即使在花費這麼長時間以後,用戶也常常相信最重要的搜索結果可能湮沒在大量無關信息中。在又一個方面,許多網際網路應用程式使用諸如WordNet(在GeorgeA.Miller教授的指導下在普林斯頓大學開發)等詞典工具來擴展用戶的查詢,以提高搜尋引擎的精度。WordNet是一種在線詞典參考系統。使用WordNet,名詞、動詞、形容詞和副詞被組織成同義詞組,其中每一個都標識一個底層的詞典概念。不同的關係連結各同義詞組。有了WordNet,用戶手動地輸入其相對於全球資訊網頁的個人分類法。因此,WordNet並非被適當地配置成緊隨網際網路及其它聯網計算機系統的迅速增長和動態改變。例如,Web中出現的單詞有一半以上沒有出現在WordNet中。發明概述此發明涉及概念網絡。概念網絡可相應於用戶查詢而生成。在一個實施例中,概念網絡配合搜索工具使用。搜索工具搜索多個數據存儲位置。每一個數據存儲位置都用一個節點來排列。這些節點中的某幾個由至少一個鏈路連接。概念網絡基於鏈路選擇這某幾個節點中的一部分,其中至少一個鏈路被用於內容目的。附圖簡述貫穿所有附圖,相同的特徵和組件引用相同的標號。圖1是一個包括概念網絡的計算機環境的實施例的框圖;圖2是開發概念網絡的一個實施例的全球資訊網站搜索部分的另一個實施例的框圖;圖3示出用於建立概念網絡的域的分類法構造的一個實施例的框圖;圖4示出可在計算機環境的顯示器上所顯現的概念網絡所顯示的結果的透視圖;圖5示出全球資訊網站結構分析算法的一個實施例的流程圖;以及圖6示出可用於推導或向用戶顯示概念網絡的計算機環境的一個實施例的框圖。較佳實施例的詳細描述此發明提供概念網絡的各種實施例。在概念網絡中,査詢等同於被搜索的概念。在概念網絡中,多個搜索結果信息被結構化地組織為向用戶顯示的多個概念。如本文所揭示的概念網絡根據搜索結果與查詢的各個概念的相關性檢索和/或顯示搜索結果(搜索結果是基於概念來排列的)。概念網絡可被配置成允許用戶基於搜索結果與用戶査詢的相關性訪問各個搜索結果、搜索結果的各個內容、或者搜索結果的各個部分。這一概念網絡是基於査詢在計算機環境中生成的。術語"概念網絡"的一個方面涉及以概念可被用戶理解和訪問的方式將概念集合為概念網絡。概念網絡的一個實施例特別針對於網際網路,即使概念網絡一般可被應用於任何計算機環境或計算機系統。在概念網絡的網際網路實施例中,用戶可輸入查詢,而所顯示的輸出概念網絡可以是可由用戶選擇的概念列表。例如,如果用戶査詢"電子系統",所顯示的概念網絡可包括諸如蜂窩電話、計算機、音頻系統、視頻系統等各種概念。由此用戶可選擇作為概念網絡顯示的這些概念中的一個,以顯示更具體的搜索結果。概念網絡的一個實施例包括顯示諸如相對於圖3所描述等多個互連概念的大型連接圖。如同來自現有技術的搜尋引擎的搜索結果一樣,概念網絡是基於用戶查詢而得到的。與現有技術的搜尋引擎相比,概念網絡增加了對客戶查詢的相應的準確性。此外,概念網絡限制大量無關的搜索結果,而這在依賴於關鍵詞查詢的現有技術的搜尋引擎中間是普遍的。圖1示出被配置成生成並顯示概念網絡100的計算機環境50的實施例的框圖。計算機環境50可包括可任選的網絡部分72(儘管該計算機也可以是獨立計算機)。計算機環境50包括搜索工具74和顯示工具75。搜索工具74和顯示工具75的部分包括概念網絡100的一個實施例的部分。提供概念網絡100作為用戶界面,搜索結果的結構化表示通過該用戶界面向用戶顯示,且搜索結果根據也可向用戶示出以指示每個返回的搜索結果的相關性的概念被結構化或排列。現有技術的搜尋引擎通常返回適用的全球資訊網頁的列表之類的結果,而如本發明中所揭示的所返回的概念網絡包括,例如根據其內容結構化排列的多個全球資訊網頁。生成概念網絡100的搜索依賴於被搜索的數據(例如,全球資訊網頁)內所包含的信息,如被搜索的數據的某個結構化特徵所指示。由此,與現有技術的搜尋引擎(基於關鍵詞匹配)相比,概念網絡所返回的結果(基於所搜索的數據的結構)一般提供更準確的搜索結果。包括概念網絡100的圖1的計算機環境50示出一般化的計算機環境。構想該概念網絡高度適用於能夠適用搜尋引擎的任何類型的計算機環境,包括獨立計算機、聯網計算機、或大型計算機。但是,本發明被描述為適用於計算機環境的特定實施例。更特別地,構想概念網絡100適用於網絡。更特別地,構想包括概念網絡100的計算機環境50的一個實施例包括排放在整個網際網路上的若干全球資訊網站上的各個全球資訊網頁。由此,概念網絡的某些實施例依賴於伺服器,它們在諸如網際網路等聯網計算機環境中向客戶機提供構成搜索結果的數據。向用戶顯示的搜索結果的結構化表示的一個實施例是基於網際網路用戶一般已知的統一資源定位器(URL)。在此揭示中描述網際網路的某些實施例中使用的URL的結構化方面。儘管此揭示描述URL為向概念網絡中所依賴的數據提供結構,但是要強調的是,可包含能為概念網絡所依賴的類似的結構化信息的任何其它機制都落入本發明的預期範圍之內。在計算機環境50的某些實施例中,提交查詢的用戶將導致有關的概念網絡100,其中所顯示的結果被組織為一系列有關的概念。一般而言,基於各種用戶査詢可獲得大量各種類型的搜索結果。由此,本揭示描述基於大量用戶查詢生成各種概念網絡。概念網絡的一個示例性例子是通過搜索"前N個"査詢(尋求任何類別的前"N"個的査詢,其中N是整數)產生的。概念網絡的另一個示例性例子在諸如"解釋電子"等複雜概念的搜索中產生有意義的結果。概念網絡100是基於概念生成的(與基於用戶查詢所提供的實際關鍵詞產生搜索結果的現有技術的搜尋引擎不同)。概念網絡100是響應於查詢,以能向用戶提供更詳細和準確的信息的方式而生成的。例如,概念網絡的某些實施例是考慮涉及査詢所提出的概念的大量全球資訊網站而生成的。概念網絡考慮每個全球資訊網站與查詢所提供的概念的相關性,然後通過概念網絡向用戶示出各個全球資訊網頁的有關部分。與依賴關鍵詞查詢結果的現有技術的搜尋引擎相比,概念網絡100能以更有組織和準確的方式顯示來自各種査詢的結果。包括了更為定向和準確的查詢相應這一事實允許概念網絡在向用戶的顯示中處理較少的全球資訊網頁。隨即可根據概念網絡所生成的相對很少的全球資訊網頁的結構來組織這些全球資訊網頁。例如,涉及一類概念的全球資訊網頁可通過概念網絡的一個部分來訪問,而涉及另一類概念的全球資訊網頁可通過概念網絡的另一個部分來訪問。因此,概念網絡100可包含涉及大量被檢索的信息(諸如全球資訊網站、全球資訊網站內容信息、或全球資訊網頁的部分)的結構信息。概念網絡100提供大多數現有技術的搜尋引擎所返回的全球資訊網頁列表上的若干改進。概念網絡100的某些實施例改為提供並顯示按(顯示概念網絡的)全球資訊網頁上的順序排列的結構化信息。對用戶而言,如圖4所示的自動生成和顯示的概念網絡100是更易理解、解釋和更為有用的形式。一般而言,與現有技術的搜尋引擎相比,概念網絡100提高搜索的精度和速度,並且提高在這些搜索期間所獲信息的相關性。--般而言,概念網絡100顯示基於數據的結構信息(例如,格式、節點之間的連結、等等)導出的相當大量的信息。在一個實施例中,此結構信息是基於統一資源定位器(URL)獲得的,儘管可使用包含所檢索的信息的結構信息的任何設備。在網際網路中,URL目前被用於導航目的,以允許瀏覽器通過網際網路訪問特定全球資訊網頁。URL還可被用於提供此揭示中所描述的用於創建概念網絡的結構信息(描述不同節點之間的關係)。此類結構信息的例子涉及,例如是另一個節點的祖先、後代、兄弟或其它關係的節點。此類結構信息被概念網絡100的各種實施例用於結構化地描述概念網絡內部的不同節點之間的關係。在概念網絡100中此類結構信息被用於提供單詞的分類或歸類。概念網絡的分類(如同現有技術的搜尋引擎)涉及特定單詞的含義。考慮到搜尋引擎內已改變含義或者被添加或移除的大量單詞,現有技術的手動搜尋引擎難以維護現行的分類法。概念網絡的某些實施例提供自動構造的分類法,基於在査詢期間所訪問的全球資訊網站的結構,該分類法適應於域和用戶。構想如本文所揭示的概念網絡100可被應用於各種計算機系統,包括但不限於,資料庫、在線購物、攝像機、個人計算機、手持式計算機、機器學習、以及計算機製造。儘管此揭示描述概念網絡100被應用於分析網際網路上的全球資訊網站,但是應當強調,這些概念適用於所有聯網的、獨立的、以及其它基於計算機的搜尋引擎。由此,將概念網絡應用於網際網路或者任何其它網絡或計算機系統都是在本發明的預期範圍之內。本揭示描述概念網絡100及相關聯組件的各種實施例。概念網絡100被設計成自動對其自身進行更新,而無需代表用戶進行任何更新。在査詢之間,計算機環境的一個實施例以與關鍵詞搜索高速緩存流行的搜索類似的方式(諸如通過使用全球資訊網站爬尋器等)不斷地進行搜索。概念網絡100的一個實施例將爬尋所有涉及所收集的概念的全球資訊網站以更新概念網絡。構想此爬尋過程類似於常規搜尋引擎所執行的那些過程。在合理的時間量內,概念網絡100能夠基於用概念網絡生成的分類法來理解大量典型用途的關鍵詞(包括它們的結構)。使用此分類法,概念網絡以結構化的方式顯示關鍵詞。由此,概念網絡能夠被用作分類詞彙彙編,因為概念網絡能夠基於分類來解釋單詞的含義。因此,概念網絡的分類(即,字典)中越來越多的單詞對搜索諸如網絡或Web等計算機環境以尋找特定技術、法律或其它此類專用單詞的用戶特別有用。幾乎所有專業都有相當大量的專用單詞,其中許多隨時間不斷更新。例如,諸如代理人、稅務專家、工程師等專業或群體基於它們特定的使用和專長的領域,每-一個都有其自己的分類法。由於每個領域都只有相對很少數量的用戶的緣故,手動搜尋引擎不更新其中的許多項。概念網絡可自動更新其中專用的、不常用的或被頻繁更新的許多項。用於得出概念網絡100的全球資訊網站搜索部分201的一個實施例在圖2中描述。全球資訊網站搜索部分201的實施例包括入口頁和爬尋器規則部分202、全球資訊網站結構分析器204、全球資訊網頁摘要部分206、全球資訊網站結構合併工具208、以及概念網絡100。全球資訊網站結構分析器204包括超連結隊列212、全球資訊網站爬尋器214、HTML語法分析器216、基於功能的對象模型(FOM)分析器218、以及超連結分析220。為生成概念網絡IOO,全球資訊網站結構分析器204分析全球資訊網站的結構。然後圖2的Web合併工具(本文中也稱為Web站點結構合併工具208)合併來自不同的結構化全球資訊網站的內容以產生可使用概念網絡來顯示的搜索結果。在常規全球資訊網站中,連結被用於導航。為分析全球資訊網站內容結構以創建每一個概念網絡IOO,連結從用於導航被轉換為用於內容。為完成此轉換,執行以下步驟a)在URL中編碼每個全球資訊網站的結構化信息。由此,在URL中編碼特定連結,而無論其是向上連結、向下連結、兄弟連結還是交叉連結。這在現有技術的搜尋引擎中是沒有的。在一個實施例中,區別連結的類型是由全球資訊網站爬尋器214通過考慮全球資訊網站爬尋器的訪問順序來執行的。b)執行聚合和關聯分析。此聚合和關聯分析包括確定各集線器和不同授權機構的位置。在一個實施例中,這可由FOM分析器218執行。c)然後區分信息連結和導航連結。此識別是使用基於功能的對象模式(FOM)來分析導航條、導航列表或獨立連結來執行的。由此,頁的布局被用來對全球資訊網頁進行分塊。在一個實施例中,c)可使用FOM分析器218來執行。現有技術的搜尋引擎在一次一個的基礎上提供對多個全球資訊網站的訪問,而概念網絡IOO被構造成同時包含從各個全球資訊網站獲得的結構信息。可在概念網絡100上以可被讀者輕易理解的方式組織來自這各個全球資訊網頁的信息。更特別地,可在概念網絡100中以呈現來自多個全球資訊網頁(通常基於URL)的結構信息的可量化的值的方式顯示來自多個全球資訊網站的類似地結構化的信息。隨即可用導致不同全球資訊網頁的主題之間的比較的方式呈現來自多個全球資訊網頁的此類結構信息。例如,涉及特定工業或主題的多個公司或集團很可能在它們的全球資訊網頁中以相似的結構包含相似類型的信息。概念網絡提供一種媒介以顯示來自不同全球資訊網頁的此相似信息;或者以允許從同一概念網絡輕易訪問不同全球資訊網頁的方式來呈現要向用戶呈現的不同但相關的全球資訊網頁。在某些實施例中,全球資訊網站結構分析器204從入口頁和爬尋器規則部分202接受全球資訊網站的進入點URL和一些全球資訊網站爬尋器規則作為輸入。這些URL包含涉及特定全球資訊網頁的各種結構信息(例如,連結的端點、全球資訊網頁的類型、等等)。常規搜尋引擎不使用由URL提供的這一結構來導出涉及全球資訊網頁的結構信息。全球資訊網站結構分析器204分析全球資訊網站結構,並向全球資訊網頁分配深度信息。結果是,全球資訊網站結構分析器204的一個實施例生成全球資訊網站的分層結構圖,其節點包括概念。由概念網絡所導出的概念可用如本揭示中所描述的關鍵詞來表徵。全球資訊網站結構分析器204導致使用結構化的全球資訊網站。全球資訊網站分析器204的一個實施例是基於BFS(廣度優先搜索)算法。全球資訊網站結構分析器204維護超連結隊列212。全球資訊網站爬尋器214從超連結隊列212取URL,然後使用全球資訊網站爬尋器214爬尋來自網際網路的超文本標記語言(HTML)原始碼,然後將HTML原始碼轉發給HTML語法分析器216。超文本隊列212是包括未經分析的超連結的隊列。在分析開始以前,全球資訊網站結構分析器204附接進入點URL。在分析期間,只有全球資訊網站爬尋器214從超連結隊列212提取URL。只有超連結分析器220應用新的未經分析的超連結。全球資訊網站的進入點URL從入口頁和爬尋器規則部分202進入全球資訊網站結構分析器204的超連結隊列212。當全球資訊網站結構分析器204開始分析時,全球資訊網站爬尋器214從超連結隊列212提取URL,然後全球資訊網站爬尋器爬尋來自網際網路的HTML原始碼,並將HTML原始碼轉發給HTML語法分析器216。HTML語法分析器處理從網際網路爬尋的HTML原始碼。HTML語法分析器216接受從全球資訊網站爬尋器214輸入的HTML原始碼。在一個實施例中,HTML語法分析器216的活動包括URL提取、URL統一、和URL分組。對於URL提取,HTML語法分析器216根據輸入的全球資訊網站定義取所有指向一全球資訊網頁並且在該全球資訊網頁內部的URL。用錨文本附接每一個URL。對於圖像連結,錨是包圍文本。對於UR統一,HTML語法分析器216的一個實施例執行多個操作,包括a)將相對URL地址轉換為直接URL地址;b)將IP位址改為域名;以及c)通過用最終目標URL地址替換該URL來解決重定向的URL的問題。對於URL分組,具有相同標籤元數和相同外觀的表格或列表中的超連結很可能被視為例如相關的節點。來自HTML語法分析器216的結果隨即被轉發給基於功能的對象模型(FOM)分析器218。基於功能的對象模型(FOM)分析器218使用FOM的基本概念和算法對超連結分配功能信息。此功能信息對分析每個全球資訊網站的結構是非常有用的。FOM表示全球資訊網頁的基於功能的對象模型。FOM分析器218不是進行語義分析,而是試圖通過表示每個對象功能和類別來理解作者的意圖。每個全球資訊網頁都可起到索引頁或內容頁的作用。一類導航對象是導航條。FOM分析器218的一個實施例執行如以下FOM分析任務等索引/內容頁識別和導航條檢測。對於索引/內容頁識別,FOM分析器218的一個實施例確定全球資訊網頁URL是否包括文本"Index"(索引)或"default"(默認),以及該URL是目錄還是索引頁。如果該頁內部有對應於子目錄的連結,則此連結是指向索引頁。將超連結和內容單詞的比值和閾值相比較。如果該比值大於閾值,則該全球資訊網頁是索引頁。如果閾值大於該比值,則該全球資訊網頁是內容頁。FOM分析器218的一個實施例提供導航條檢測。導航條中的項是彼此互連的,並且對應的連結拓撲結構是完全連通圖。FOM分析器218的輸出包括多個超連結,它們被轉發給超連結分析器220。FOM分析器218為全球資訊網頁提供分塊。在一個實施例中,分塊以後,基於其功能,全球資訊網頁被分成若干小單元,諸如內容塊、導航塊、廣告塊、等等。這些小單元可由用戶單獨訪問。超連結分析器220的一個實施例使用全球資訊網站結構分析算法來處理FOM分析器218所分析(並從該處發來)的每一個超連結。經語法分析的原始碼被轉發到FOM分析器218以執行功能分析。超連結分析器220根據全球資訊網站結構分析規則分析每一個超連結,而新的未經分析的超連結被插入到超連結隊列212中。超連結分析器220對每一個全球資訊網頁分配一個深度值(並維護全球資訊網站的臨時分層結構圖)。該深度值可由全球資訊網站爬尋器214輸出。在一個實施例中,全球資訊網站爬尋器214通過廣度優先搜索訪問全球資訊網站。行進路徑將被構成為樹的格式,樹的節點是全球資訊網頁,節點內部的連結是全球資訊網頁內部的超連結。因此樹中節點的深度是我們想要獲得的值。例如,進入點全球資訊網頁的深度(諸如由URLh加:〃www.microsoft.com所標識的進入點頁)是0。相比之下,由URLhttp:〃www.microsoft.com/china所標識的全球資訊網頁的深度是l。全球資訊網站結構分析器204構造了可被視為在超連結隊列212處開始和結束的循環。全球資訊網站爬尋器214從超連結隊列212提取下一個UR1以開始下一個循環。執行此動作直至超連結隊列212中沒有新的URL為止。分析過程完成,全球資訊網站(稱為結構化的全球資訊網站)的分層結構圖被構造出來。每個全球資訊網站的結構化信息是以可使用超連結分析器220檢測的方式編碼到URL中的。由此,無論特定連結是向上連結、向下連結、兄弟連結或交叉連結,它都被編碼到URL中(並可使用超連結分析器220檢測)。在一個實施例中,使用基於URL塊長度的啟發式規則來檢測向上連結和向下連結。URL塊長度被定義為塊數,塊是URL中被"/"或"?"分開的部分。例如,URL"http:〃麗w.sonvstvle.com/digital/digitalcamera.htm"的URL塊長度是3,包括"http:〃www.so蹈tvle.com"、"digital"禾口"digitalcamera"。在一個實施例中,應用約束的規則來分析URL。然後,對於未被規則覆蓋的其餘URL,使用以上策略來進行分析。超連結檢測規則的一個實施例根據兩個規則來描述。第一規則是,如果URL塊長度(超連結)小於或等於全球資訊網頁的URL塊長度,則該超連結是向上連結。第二規則是,如果URL塊長度(超連結)減去URL塊長度(全球資訊網頁的URL)大於或等於2,則該超連結是前向連結。假定當前全球資訊網頁節點為B,它有到全球資訊網頁C的超連結。全球資訊網站結構分析器204的超連結分析器部分220進行以下過程I.如果該超連結是向上連結,則將其丟棄(不再考慮)。II.如果B和C屬於導航條,則B和C是兄弟節點(如本文所討論)。III.如果C己被訪問,且B的URL塊長度大於或等於C:如果B是索引頁;則C是B的子節點(如本文所討論);否則如果B是內容頁,則C是B的兄弟節點。IV.如果C未被訪問,如果B是內容頁,則C是B的兄弟節點,否則C是B的子節點。否則如果C尚未被訪問,則首先如果B是內容頁或在若干頁中被顯示,則該連結是顯式關聯。否則此連結是聚合。在分析超文本隊列中的URL以後,使用全球資訊網頁摘要部分206得出全球資訊網站結構。例如,全球資訊網頁中所包含的某個量的數據可能與特定用戶的査詢有關,而其它數據則無關。全球資訊網頁摘要以可在概念網絡100內的特定概念部分上顯示的形式提供有關的信息。因為不在概念網絡上示出每一個全球資訊網頁的整體,所以概念網絡可提供可由用戶訪問的每個概念或全球資訊網頁的信息的更為定向的摘要。隨即使用全球資訊網站結構合併工具208將從全球資訊網頁摘要部分206導出的不同全球資訊網頁的各種各樣的內容(或其它內容)合併到概念網絡100中。全球資訊網站結構用分層結構圖表示。概念網絡100的某些實施例分析相關全球資訊網站的結構,並據此將結果合併到一起。在此揭示中,將來自多個全球資訊網站的信息合併被稱為Web合併,如圖2所示由全球資訊網站結構合併工具208執行。全球資訊網站結構合併工具208所執行的Web合併提高概念網絡的精度和速度,並被執行如下。在每個全球資訊網站都被結構化為"樹狀圖"或"深度圖"以後,接下來的問題是將這些圖合併成一個網絡。在該網絡中,每個節點表示一個概念,而這些節點之間的連結表示這些概念之間的關係。基本關係可包括,但不限於,超義詞、假義詞、同義詞、等等。因為每個全球資訊網站都表示原始編輯者對有關主題的觀點,所以將不同的觀點合併為一個觀點有點困難。因此在以下,我們給出將來自各種類型的資源的概念分層結構合併成一個可用的分層結構的解決方案。為示出如何合併概念網絡的分層結構的一個實施例,從兩個不同的分層結構//合併給定概念C的一類關係i。解決此問題的詳細算法如下以下技術表示可用於執行本體合併過程的一個實施例a)對於每個Web塊,使用如圖2所示的全球資訊網頁摘要部分206為全球資訊網頁簡述概念。這些概念被解釋為關鍵詞集合。b)然後對這些概念進行令牌化,通過此方法,要通過概念網絡100來生成和顯示的每個概念都由"令牌"短語或關鍵詞表示。由此,建立關鍵詞集合以表示和描述概念網絡中所包含的概念。(l)被用於最終生成概念formulaseeoriginaldocumentpage13(1)其中^,^,2,...,,表示單詞,而n,表示單詞數組,",是概念網絡中一個節點(全球資訊網頁)的摘要,它可被分解為若干單詞/短語,即^,,.2,...,,。c)在分層結構樹上提供滑動窗口,以分別用(2)、(3)和(4)來生成後代(offspring)、祖先(ancestor)和兄弟(sibling)的子樹ST。假定一些單詞在不同的窗口中出現。formulaseeoriginaldocumentpage13其中,^(o炎pn'"g)、S7;(""ce加。和S7;Cy/W/"g)是用於計算後代、祖先和兄弟關係的子樹;M"^、/^M"和W'fe,分別代表節點",的第d層子節點、父節點和兄弟節點。d)對於每一個所生成的子樹(例如,"(朋"加0),按等式(5)計算術語對的互信息。計算每個單詞對w,,,的的互信息ML具有高值的互信息指示該單詞對是相似的。formulaseeoriginaldocumentpage14其中,M/(w,,w,)是項w,和w,的互信息;e(w,,w7)表示項w,和,一起在子樹中出現的概率;(x可為w,或,)表示項x在子樹中出現的概率。確定一對項的相關性的另一個因素是項對的分布。越多子樹包含該項對,則這兩個項就越相似。在我們的實現中,使用熵(entropy)來測量項對的分布,如步驟(d)中所示。d)計算每個單詞對w,,^的熵。基於在(5)中確定的互信息實際上在所有全球資訊網站中是共同的,熵轉換是對被確定為共同的單詞對w,,的度量,。熵越高,概念網絡可向用戶提供的該單詞在所有全球資訊網站之間成對的信心就越高。formulaseeoriginaldocumentpage14e)根據(ll)計算每個單詞對的相似性S/m:formulaseeoriginaldocumentpage14如(ll)中所闡述的相似性將互信息M/(w,,,)和e"的"(w,,,)相結合。為指示涉及(2)、(3)和(4)的有關概念(後代、祖先和兄弟),概念網絡生成各種有關的類別。例如,表1示出公知概念的各種示例性後代概念表l:tableseeoriginaldocumentpage1414tableseeoriginaldocumentpage15表2示出各種示例性的袓先概念表2:祖先概念tableseeoriginaldocumentpage15表3示出各種示例性兄弟概念:tableseeoriginaldocumentpage15圖2中所示的概念網絡100的一個實施例被規定為圖3中的結構形式、以及圖4中其向用戶所呈現的形式中所示出的有向圖。概念網絡所基於的有向圖(G)300由(12)描述G=(V,E)(12)其中V是節點的集合,而E是邊或連結的集合。由此,如有向圖所表示的概念網絡100包括多個節點以及連結這些節點的多個連結或邊。節點表示概念。邊或連結表示概念之間的關係。如圖4中所示的概念網絡100的有向圖300由此提供內容結構。全球資訊網頁的內容結構被信息挖掘以產生用於生成概念網絡的信息。圖3示出用於使用概念網絡100構造特定域的分類的技術的一個實施例。圖3以導出一個或多個域專屬的全球資訊網站302而開始。這可通過利用現有的元搜尋引擎來進行此工作來完成。例如,如果用戶想要構造"數字攝像機"域的概念網絡,用戶可向搜尋引擎發送査詢,並使用前IOO個全球資訊網站來構造概念網絡。每個域專屬的全球資訊網站302包括對應於內容(由節點表示)的分析和連結結構(由連結結構表示)的分析的結構。產生概念網絡100依賴於一個或多個全球資訊網站的內容結構的有效挖掘。此挖掘可通過分析連結類型來執行,連結類型確定連結是後代連結、祖先連結、還使兄弟連結,諸如相對於圖2的超連結分析器220所述。這些連結類型中的一個被分配給每個連結。然後使用如圖2中所示的全球資訊網頁摘要部分206來簡述節點的語義。在圖3中,域專屬分類是基於此信息挖掘而導出的。注意,與諸如WordNet⑧等要求手動的編輯輸入以進行分類的現有技術的工具相比,在本揭示中,域專屬分類的導出是自動執行的。Wordnet是針對一般域的手動構造分類。此分類是由編輯者而不是端點用戶構造的。信息挖掘依賴於域專屬全球資訊網站的連結結構和內容。這與某些現有技術的自動分類詞彙彙編構造不同,在後者中,信息是從內容而不是連結結構挖掘的。然後使用本體學習來構造概念網絡100。基於本體學習,自動構造的概念網絡開發其自身的分類。本體學習是基於統計框架,並且能夠產生多個編輯者的視圖。統計框架容易被應用於許多統計應用程式。如圖3中所示地構造的概念網絡100描述電子的各種概念網絡。概念網絡100包括各種Web塊450,其中每個Web塊表示一個不同的電子類別(例如,電子產品、電子類別、以及電子設備製造商、等等)。每個Web塊由用戶可識別的關鍵詞描述。每個子Web塊454可被視為與主Web塊相關。例如,在圖3中,單詞"電子"表示主Web塊452。術語"電子"表示好的主Web塊452,因為此術語出現在許多涉及各種產品(各種產品中的每一種都可被視為一個子Web塊)的全球資訊網站中。例如,在圖3中,在電子主Web塊下示出各種子Web塊454(包括照像機和相片、音頻和視頻、手持式、蜂窩電話、計算機、Sony、iPAQ、Palm⑧、外設、以及各種Comp叫⑧產品)。在此揭示中,每個Web塊都被視為包含同構信息的一個概念。因此術語"概念網絡"描述多個概念,或Web塊的網絡。每個Web塊都可由一個關鍵詞(諸如照相機、計算機、以及"Sony",如圖3中所示)簡述。圖3中每個子Web塊的主題極大地涉及主Web塊電子,因此可被寬泛地歸類到概念"電子"之下。基於Web塊的結構、挖掘、以及概念網絡100的域專屬分類,如圖3中所示的電子的概念網絡包含這些術語中的許多。圖3中所示的所生成的概念網絡100可被視為自動構造的最終結果。圖4中示出示例性概念網絡100的一個實施例,如其在諸如平面顯示器或CRT監視器等計算機顯示器200上所顯現的。由此,圖4示出所生成的包括各種概念402的概念網絡100(使用圖2和3中所示出的技術)。每個概念402包括涉及以此方式所生成的至少一個Web塊450,其中某些實施例在圖3中示出。因此圖4中示出的概念網絡100包含覆蓋在顯示器上的若干概念402。就所關注的領域(在此實例中為"電子")相對地詳述了概念網絡的細節。例如,這些概念中的幾個如果被用戶選擇,則會將用戶帶到比當前所顯示的概念網絡更狹隘或更寬泛的另一個概念網絡。例如,用戶可從電子概念網絡轉移到計算機概念網絡。通過搜索所有各種全球資訊網站執行概念網絡的分析。分析指出在概念網絡的某些實現中,被正確定位的全球資訊網站的百分比有所提高(增至75%)。就準確性而言,這表示現有技術上的顯著進步。考慮示例性查詢"數字攝像機製造商"。典型的現有技術的搜尋引擎搜索整個Web並返回包含關鍵項"數字"和/或"攝像機"和/或"製造商"的全球資訊網頁。因而此類現有技術的搜尋引擎將返回相當大量的無關全球資訊網頁。概念網絡100僅需搜索從節點"數字攝像機"擴展的子圖。因此,概念網絡速度更快,並且所返回的無關全球資訊網頁的數量顯著減少。概念網絡100提高對査詢的期望響應的簡單程度、速度和可靠性。首先,在概念網絡100中定位項"數字攝像機"。所有指向節點"數字攝像機"或其所指向的節點都被提取。然後屬性為"製造商"的節點被選擇並分級(例如,基於點擊數)。如此,便可搜索對任何類別的全球資訊網頁的前N個的查詢(最大的公司、最大的製造商、最多的辦公室、最近的位置、等等),而捕獲合理數量的準確點擊的概率大大提高。由概念網絡所表徵的此類改良的搜索得以發生是因為查詢是定向到被搜索的全球資訊網站的結構(如URL內所包含)。如相對於圖5所描述的概念網絡100的某些實施例可提供各種搜索服務,它們可搜索如網際網路上的全球資訊網站上所列出的前"N"個(其中"N"是某個正數)組織、公司、項目、群組、產品等等的某個可量化的闡述。例如,某些實施例生成提供找出世界上前五個數字攝像機製造商的查詢的搜索結果的概念網絡100。另一個査詢提供諸如指示歐洲前五個鋼鐵製造公司等另一個複雜查詢的搜索結果。預期概念網絡高度有益的一類査詢依賴於基於全球資訊網站的結構(例如,基於URL所提供的結構)來訪問數據。"前N"類型的査詢基於多個全球資訊網站的結構來分析和返回信息。例如,一種確定誰是美國前三名的汽車生產商的技術涉及訪問所有可能的汽車生產商的全球資訊網站,從每個全球資訊網站導出類似的生產信息,然後比較從不同的全球資訊網站導出的生產信息。由此,概念網絡100的某些實施例可搜索全球資訊網頁內的詳細特徵。數據挖掘針對於此類全球資訊網站分析。一般而言,數據挖掘(有時稱為數據或知識發現)是基於查詢從不同角度分析數據並向用戶將數據總結為有用信息的過程。數據挖掘軟體是用於分析數據的許多分析工具中的一種。它允許用戶從許多不同的方面或角度分析數據、歸類數據、以及總結所標識出來的關係。技術上,數據挖掘是在大型關係型資料庫中的幾十個欄位之間尋找相關性或模式的過程,並且通常在査詢中是公知的。由此,概念網絡的某些實施例可使用如圖3所提供的數據挖掘306來導出域專屬的分類304。圖5示出導致生成概念網絡的過程600的一個實施例。過程600包括用戶將査詢輸入到計算機環境50(如圖1中所示)中的602。該査詢將導致生成並向用戶顯示概念網絡。在604,該查詢給提交給如相對於圖3所描述的多個域專屬的全球資訊網站302。這些全球資訊網站由常見的元搜尋引擎或人類構建的Web分層結構返回。在606,計算機環境通過諸如考慮對相關聯全球資訊網站的URL結構和內容等來分析全球資訊網站結構。在610,被挖掘的信息被用於生成域專屬分類(如相對於圖3中的304所描述)。過程600前進至612,生成並向用戶顯示概念網絡100。概念網絡100能夠被生成以返回對諸如"解釋單詞電子"等査詢的響應(這是現有技術的搜尋引擎所不能執行的)。此類概念網絡也是通過分析各種全球資訊網站和全球資訊網頁的結構來生成的(如圖5中的查詢的情形)。概念網絡的一個實施例保存全球資訊網站的結構信息,此信息標識編輯者對概念的分層結構的觀點。在概念網絡100中,不同編輯者的觀點被合併到一起,從而用戶可確定什麼是最常見的解釋。概念網絡100的某些其它實施例可提供確定用戶執行諸如解釋單詞"電子"等任務的最佳全球資訊網站的査詢。此類査詢可被視為解釋和/或比較的查詢。由此,必須由概念網絡對若干全球資訊網站進行評估和比較。生成此類概念網絡(諸如能夠解釋複雜問題的概念網絡等)所涉及的一種機制牽涉到考慮涉及査詢所提出的問題的大量全球資訊網站;在某種程度上如現有技術的搜尋引擎所可測量地考慮每個全球資訊網站的相關性,然後向概念網絡的用戶顯示全球資訊網頁的有關部分。圖5的過程600的實施例也可被用於執行此類查詢。為響應這些類型的相對複雜的查詢(前N類型的査詢,或者必須評估和比較多個全球資訊網站的查詢,等等),通過評估所考慮的每個全球資訊網頁或全球資訊網站的結構來構造概念網絡100。現有技術的搜尋引擎不能夠從全球資訊網站導出該結構以執行這些分析(因此不能響應於此類査詢)。例如,相關於電子的例子,概念網絡考慮被結構化的全球資訊網頁,以提供定位到準確描述電子主題處足夠的信息。概念網絡100在查詢擴展中也非常有用。目前,許多網際網路應用程式使用現有技術的WordNet來擴展用戶的査詢以提高現有搜尋引擎的精度。但是,WordNet是手動構造(分類詞彙彙編)的高強度勞動的工作。幾乎沒有哪個全球資訊網站願意手動構造分類詞彙彙編。全球資訊網站操作者更喜歡自動分類詞彙彙編構造。用戶的手動分類詞彙彙編構造不適合於網際網路的迅速增長。諸如網際網路等網絡中的文檔數量不斷增長。越來越多的新單詞和概念不斷出現,這使得如在本揭示中所描述的概念網絡的有用性得以突出。與依賴於關鍵詞比較的現有技術的搜尋引擎相比,概念網絡返回較少的、但更為定向的結果。因此,用戶較易評估概念網絡所返回的每一個結果。此外,用戶較易評估査詢是否未能返回期望類型的結果,從而用戶將能夠修改原始査詢使之更為定向。現用分類詞彙彙編(概念網絡可發揮此作用)對網際網路和其它網絡搜索是有用的。此外,概念網絡100不但包含概念的分層結構,而且還包含這些概念的統計信息。因此它可被輕易地應用於諸如調查等某些關於普及性的特定問題。因為概念網絡100的一個實施例為網際網路和其它網絡環境合併來自所有作者的單詞和概念的觀點,所以概念網絡IOO可被視為向網絡用戶提供替換的分類詞彙彙編。概念網絡100可被適應於客戶方以作為個人分類詞彙彙編。用戶的瀏覽路徑將生成Web的子空間。類似的方法可被應用來分析Web的子空間,以生成個人頻繁使用的概念的關係。因此概念網絡提供全球資訊網頁的摘要。超連結和頁標題上的文本可被用作全球資訊網頁的摘要。在另一個實施例中,自然語言語法分析(NLP)技術可被集成到全球資訊網站搜索部分201中(可作為HTML語法分析器216的一部分),以使用某些主導關鍵詞來總結文檔。此揭示描述各種概念網絡100。概念網絡可被視為通過分析多個全球資訊網站的結構並合併分析結果而從全球資訊網站構建的網際網路概念網絡。概念網絡100在提高搜尋引擎的精度和速度方面特別有用。概念網絡從全球資訊網站結構、而不是單純地從全球資訊網站內所包含的明文文本中提取知識。概念網絡提供域的自動構造。來自概念網絡的統計結果揭示各個全球資訊網站中所包含的一般知識。由此,概念網絡不僅從特定全球資訊網站獲得信息,而且還從網絡上大量各種各樣的全球資訊網站獲得知識。概念網絡可使用本體學習來維護涉及全球資訊網站的結構信息。因此,當新的全球資訊網頁和概念被應用於網際網路時,本體允許來自全球資訊網頁的結構信息被自動集成到概念網絡中。此外,概念網絡IOO可提供普通搜尋引擎所不能提供的一些服務,諸如"找出世界上前N個數字攝像機製造商"以及"解釋單詞電子"等。概念網絡還可對查詢擴展起到現用網際網路分類詞彙彙編的作用,因為它提供如此多樣的子Web塊,它們通過主Web塊相互關聯,如圖3中所示。圖6示出合適的計算機環境或網絡500的示例,其中包括可生成概念網絡的用戶界面。計算機環境500表示圖1中所示的計算機環境的一個實施例。類似的資源可使用本文中所描述的計算機環境和過程。圖6中所示出的計算機環境500是一般計算機環境,它可用於實現本文中所描述的概念網絡技術。計算機環境500隻是計算機環境的一個例子,它並不試圖對計算機和網絡體系結構的使用範圍或功能提出任何限制。也不應將計算機環境100解釋為具有涉及在示例性計算機環境中所示出的任一組件或其組合的任何依賴性或要求。計算機環境100包括計算機502形式的通用計算設備。計算機502可包括,例如以下組中的一個或多個,該組包括獨立計算機、聯網計算機、大型計算機、PDA、電話、微型計算機或微處理器、或與存儲器結合使用處理器的任何其它計算機設備。計算機502的組件可包括,但不限於,一個或多個處理器或處理單元504(可選地包括加密處理器或協處理器)、系統存儲器506、以及耦合包括處理器504和系統存儲器506在內的各個系統組件的系統總線508。系統總線508表示若干類型的總線結構中的一種或數種,包括存儲器總線或存儲器控制器、外圍總線、加速圖形埠、以及使用各種總線體系結構中的任何一種的處理器或局部總線。作為示例,此類體系結構可包括工業標準體系結構(ISA)總線、微通道體系結構(MCA)總線、增強型ISA(EISA)總線、視頻電子標準協會(VESA)局部總線、以及也稱為Mezzanine總線的外圍組件互連(PCI)總線。計算機502通常包括各種計算機可讀介質。這些介質可以是可由計算機502訪問的任何可用介質,並包括易失性和非易失性、可移動和不可移動介質。系統存儲器506包括諸如只讀存儲器(ROM)512等非易失性存儲器和/或諸如隨機存取存儲器(RAM)510等易失性存儲器形式的計算機可讀介質。包含諸如在啟動期間幫助在計算機502內部各元件之間傳遞信息的基本例程的基本輸入/輸出系統(BIOS)514存儲在ROM512中。RAM510通常包含可由處理單元504即時訪問和/或正由其操作的數據和/或程序模塊。計算機502還可包括其它可移動/不可移動、易失性/非易失性計算機存儲介質。作為示例,圖6示出用於讀和寫不可移動、非易失性磁介質(未示出)的硬碟驅動器515,用於讀和寫可移動、非易失性磁碟520(例如,"軟盤")的磁碟驅動器518,以及用於讀和/或寫諸如CD-ROM、DVD-ROM或其它光介質等可移動、非易失性光碟524的光碟驅動器522。硬碟驅動器515、磁碟驅動器518和光碟驅動器522每一個都由一個或多個數據介質接口527連接到系統總線508。或者,硬碟驅動器515、磁碟驅動器518、以及光碟驅動器522可由一個或多個接口(未示出)連接到系統總線508。各盤驅動器及其相關聯的計算機可讀介質為計算機502提供計算機可讀指令、控制節點數據結構、程序模塊以及其它數據的非易失性存儲。儘管該例示出硬碟驅動器515內的硬碟、可移動磁碟520和非易失性光碟524,應當認識到,能存儲可由計算機訪問的數據的其它類型的計算機可讀介質也可被用於實現示例性計算機環境500,諸如磁帶盒或其它磁存儲設備,快閃記憶體卡、CD-ROM、數字多功能盤(DVD)或其它光存儲,隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM),等等。可在硬碟驅動器515內所包含的硬碟、磁碟520、非易失性光碟524、ROM512、和/或RAM510上存儲任何數量的程序模塊,例如包括,OS526、一個或多個應用程式52S、其它程序模塊530、以及程序數據532。OS526、一個或多個應用程式528、其它程序模塊530、以及程序數據532中的每一個(或其組合)可實現支持分布式文件系統的所有或部分常駐組件。用戶可經由諸如鍵盤534和定位設備536(例如,"滑鼠")等輸入設備將命令和信息輸入到計算機502中。其它輸入設備538(未具體示出)可包括話筒、操縱杆、遊戲墊、圓盤式衛星天線、串行埠、掃描儀和/或其它。這些及其它輸入設備經由耦合到系統總線508的輸入/輸出接口540連接到處理單元504,但也可由諸如並行埠、遊戲埠或通用串行總線(USB)等其它接口和總線結構連接。監視器、平面顯示器、或其它類型的計算機顯示器200可經由諸如視頻適配器544等接口連接到系統總線508。除了計算機顯示器200以外,其它輸出外圍設備可包括諸如揚聲器(未示出)和印表機546等組件,它們可經由輸入/輸出接口540連接到計算機502。計算機502可使用到諸如遠程計算機548等一個或多個遠程計算機的邏輯連接在聯網環境中工作。例如,遠程計算機設備548可以是個人計算機、可攜式計算機、伺服器、路由器、網絡計算機、對等設備、或其它普通網絡節點、遊戲控制臺、等等。圖示遠程計算機設備548為可包括在本文中相對於計算機502所描述的許多或所有元件的可攜式計算機。計算機502和遠程計算設備548之間的邏輯連接被示為區域網(LAN)550和一般廣域網(WAN)552。此類網絡環境常見於辦公室、企業範圍的計算機網絡、內聯網和網際網路。當在LAN網絡環境中實現時,計算機502經由網絡接口或適配器554連接到區域網550。當在WAN網絡環境中實現時,計算機502通常包括數據機556或用於通過廣域網552建立通信的其它裝置。可以是內置或外置於計算機502的數據機556可經由輸入/輸出接口540或其它適當機制連接到系統總線508。應當認識到,所示網絡連接是示例性的,並且可以使用在計算機502和548之間建立通信鏈路的其它裝置。在諸如以計算機環境500所示的聯網環境中,相對於計算機502所描述的程序模塊或其部分可存儲在遠程記憶存儲設備中。作為示例,遠程應用程式558駐留在遠程計算機548的記憶設備上。為說明的目的,應用程式及諸如作業系統等其它可執行程序組件在本文中被示為離散的Web塊,儘管可以認識到,這些程序和組件在各個時間駐留在計算機502的不同存儲組件中,並由計算機502的數據處理器執行。可以認識到,所示出並描述的網絡連接是示例性的,並且可以使用建立計算機之間的通信鏈路的其它裝置。本文中在一個或多個計算機或其它設備所執行的諸如程序模塊等計算機可執行指令的通用上下文中描述各種模塊和技術。一般而言,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、控制對象650、組件、控制節點數據結構654、等等。通常,在各實施例中可按需組合或分布各程序模塊的功能。這些模塊和技術的一個實現可被存儲在某種形式的計算機可讀介質上,或可通過其發送。計算機可讀介質可以是可由計算機訪問的任何可用介質。作為示例,而非限制,計算機可讀介質可包括"計算機存儲介質"和"通信介質"、"計算機存儲介質"包括以用於存儲諸如計算機可讀指令、控制節點數據結構、程序模塊或其它數據等信息的任何過程或技術實現的易失性和非易失性、可移動和不可移動介質。計算機存儲介質包括,但不限於,RAM、ROM、EEPROM、快閃記憶體或其它存儲器技術,CD-ROM、數字多功能盤(DVD)或其它光存儲,磁帶盒、磁帶、磁碟存儲或其它磁存儲設備,或可用於存儲所需信息並可由計算機訪問的任何其它介質。"通信介質"通常具體化為諸如載波或其它傳輸機制等已調製數據信號中的計算機可讀指令、控制節點數據結構、程序模塊或其它數據。通信介質還包括任何信息傳遞介質。術語"已調製數據信號"指以在信號中以將信息編碼的方式設置或改變其一個或多個特徵的信號。作為示例,而非限制,通信介質包括諸如有線網絡或直接連線連接等有線介質,以及諸如聲學、RF、紅外和其它無線介質等無線介質。以上任何組合也被包括在計算機可讀介質的範圍之內。儘管使用專屬於結構和功能特徵和/或方法的語言描述了系統、介質、方法、方式、過程等,但是應當理解,所附權利要求書中所定義的本發明不必被限制於所描述的具體特徵或方法。相反,揭示這些具體特徵和方法是將其作為實現要求保護的發明的示例性形式。權利要求1.一種方法,包括考慮多個域專屬全球資訊網站;通過分析所述多個域專屬全球資訊網站的相對內容導出域專屬分類;以及基於所述域專屬分類規劃概念網絡。2.如權利要求1所述的方法,其特徵在於,所述域專屬分類是基於信息挖掘而導出的。3.如權利要求2所述的方法,其特徵在於,所述信息挖掘基於連結結構和內容。4.如權利要求1所述的方法,其特徵在於,所述概念網絡是基於熵來規劃的。5.如權利要求l所述的方法,其特徵在於,所述概念網絡是基於互信息來規劃的。6.如權利要求1所述的方法,其特徵在於,所述概念網絡是基於相似性來規劃的。7.—種方法,包括生成概念網絡,包括基於從用戶提交的査詢,分析關於多個全球資訊網站的結構信息;基於所述多個全球資訊網站的結構信息,確定對"前N個"類型的査詢的響應;以及向用戶返回涉及所確定的響應的信息。8.如權利要求7所述的方法,其特徵在於,所述結構信息基於統一資源定位器URL。9.如權利要求7所述的方法,其特徵在於,所述結構信息基於每個全球資訊網頁內的隱藏概念。10.—種方法,包括生成概念網絡,包括基於從用戶提交的査詢,分析關於多個數據存儲位置的結構信息;基於所述多個數據存儲位置的結構信息,確定對相關性類型的查詢的響應;以及向用戶返回涉及所確定的響應的信息。11.如權利要求10所述的方法,其特徵在於,所述結構信息基於統一資源定位器URL。12.如權利要求10所述的方法,其特徵在於,所述結構信息基於每個數據存儲位置內的隱藏信息。13.如權利要求10所述的方法,其特徵在於,所述數據存儲位置包括全球資訊網頁。14.一種具有用於生成概念網絡的計算機可執行指令的計算機可讀介質,包括基於從用戶提交的查詢,分析關於多個全球資訊網站的結構信息;基於所述多個全球資訊網站的結構信息,確定對相關性類型的查詢的響應;以及向用戶返回涉及所確定的響應的信息。15.—種方法,包括通過以下動作自動導出域專屬分類基於從用戶提交的査詢,分析關於多個數據存儲位置的結構信息;基於所述多個數據存儲位置的結構信息,確定對相關性類型的查詢的響應。16.如權利要求15所述的方法,其特徵在於,還包括使用所述域專屬分類生成概念網絡。全文摘要一種可響應於用戶查詢而被生成的概念網絡(100)。在一個實施例中,概念網絡(100)配合搜索工具使用。該搜索工具搜索多個數據存儲位置。每個數據存儲位置都用一個節點(302)來排列。這些節點中的某幾個至少用一個連結(306)相連。該概念網絡(100)基於該連結(306)選擇這些節點中的某幾個中的一部分,其中這至少一個連結是用於內容目的(306)。文檔編號G06FGK101256581SQ200810081579公開日2008年9月3日申請日期2004年4月12日優先權日2003年5月1日發明者S·劉,Z·陳,馬維英申請人:微軟公司