使用歷史搜索結果生成改進的文檔分類數據的製作方法
2023-10-09 12:31:24 1
專利名稱:使用歷史搜索結果生成改進的文檔分類數據的製作方法
技術領域:
所公開的實施例一般地涉及在客戶端-伺服器環境上提供的在線服務,更具體地涉及用於對信息進行分類並且使用分類的信息提供定製在線服務的系統和方法。
背景技術:
藉助於如Google的搜尋引擎,網際網路已經成為了人們接收信息的主要場所。但是找到並派發與特定個人的需求和搜索興趣最佳匹配的信息已經成為了搜尋引擎所面臨的挑戰。首先,不同的個人對於信息具有十分不同的偏好,並且難以準確識別個人的搜索興趣。這個問題由於人的興趣經常是動態的 且隨時間變化而更為複雜。其次,網際網路上的許多網頁是未分類或錯誤分類的。沒有對網頁所提供的信息建立簡檔所必需的分類數據,搜尋引擎的服務質量會由於在搜索結果中包括較不相關的網頁同時錯失更為相關的網頁而受到不利的影響。
發明內容
在一些實施例中,在遠離客戶端設備的伺服器系統處,所述伺服器系統分別訪問關於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息以及所述第一信息項的分類數據。最初,所述第一信息項被分類而所述第二信息項未被分類。基於所述第一信息項的分類數據以及所述歷史查詢信息,所述伺服器系統為所述第二信息項生成分類數據並且將所生成的分類數據存儲於其中。響應於來自客戶端設備的對服務的請求,所述伺服器系統使用所述第二信息項以及為所述第二信息項所生成的相應分類數據向所述客戶端設備提供定製服務。在一些實施例中,一種遠離客戶端設備的伺服器系統包括一個或多個處理器、存儲器以及一個或多個程序。所述程序存儲在所述存儲器中並且被配置為由所述處理器執行。所述程序包括用於分別訪問關於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息以及所述第一信息項的分類數據的指令。所述第一信息項最初被分類而所述第二信息項最初未被分類。所述程序還包括用於基於所述第一信息項的分類數據以及所述歷史查詢信息為所述第二信息項生成分類數據的指令;用於將所生成的分類數據存儲在所述伺服器系統中的指令;以及用於使用所述伺服器中存儲的相應分類數據向多個客戶端設備提供與所述第二信息項相關聯的定製服務的指令。在一些實施例中,一種其中存儲有指令的計算機可讀存儲介質,當被伺服器系統的一個或多個處理器執行時,所述指令使得所述伺服器系統分別訪問關於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息以及所述第一信息項的分類數據。所述第一信息項最初被分類而所述第二信息項最初未被分類。當被所述伺服器系統的一個或多個處理器執行時,所述指令還使得所述伺服器系統基於所述第一信息項的分類數據以及所述歷史查詢信息為所述第二信息項生成分類數據,將所生成的分類數據存儲在所述伺服器系統中,並且使用所述伺服器中存儲的相應分類數據向多個客戶端設備提供與所述第二信息項相關聯的定製服務。
圖I是根據本發明一些實施例的包括信息伺服器系統的分布式客戶端-伺服器計算系統的框圖。圖2A是依據一些實施例的查詢日誌資料庫用來存儲用戶集合的歷史查詢信息的數據結構的框圖。圖2B是依據一些實施例的查詢簡檔資料庫用來存儲查詢簡檔集合的信息的數據結構的框圖。圖2C是依據一些實施例的信息分類資料庫和信息分類種子資料庫用來存儲信息 項集合的信息的數據結構的框圖。圖2D是依據一些實施例的用戶簡檔資料庫用來存儲用戶簡檔集合的信息的數據結構的框圖。圖3A是圖示依據一些實施例的用於構建查詢簡檔資料庫的示例性過程的流程圖。圖3B是圖示依據一些實施例的用於構建信息分類資料庫的示例性過程的流程圖。圖3C是圖示依據一些實施例的用於構建用戶簡檔資料庫的示例性過程的流程圖。圖3D是圖示依據一些實施例的使用其它信息項的分類數據對信息項進行分類的示例的框圖。圖4是圖示依據一些實施例的用於處理查詢並且使用用戶簡檔和信息分類數據對相應查詢結果進行排序的示例性過程的框圖。圖5A是圖示依據一些實施例的用於生成分類數據並且使用所述分類數據提供定製服務的示例性過程的流程圖。圖5B是圖示依據一些實施例的用於使用用戶的用戶簡檔和分類數據向遠程客戶端設備處的用戶提供個性化搜索結果的示例性過程的流程圖。圖6是依據一些實施例的示例性客戶端設備的框圖。圖7是依據一些實施例的示例性伺服器系統的框圖。
具體實施例方式現在將詳細參見實施例,其示例在附圖中進行圖示。雖然將結合所述實施例對本發明進行描述,但是將要理解的是,本發明並不局限於這些特定實施例。相反,本發明包括落入所附權利要求的精神和範圍之內的替換、修改和等同形式。給出多種特定細節是為了提供對這裡所呈現的主題的全面理解。但是對於本領域技術人員顯而易見的是,所述主題可以在沒有這些特定細節的情況下進行實踐。在其它實例中,沒有對已知的方法、過程、組件和電路進行詳細描述以免不必要地對實施例的多個方面造成混淆。圖I是根據本發明一些實施例的分布式客戶端-伺服器計算系統100的框圖,其包括信息伺服器系統130。信息伺服器系統130通過一個或多個通信網絡120連接到多個客戶端104和網站102。網站102可以包括與網際網路上的域名相關聯的網頁114的集合。每個網站(或網頁)具有內容位置標識符,例如統一資源定位符(URL),其唯一地識別網站在網際網路上的位置。客戶端104(有時被稱作「客戶端系統」或「客戶端設備」或「客戶端計算機」)可以是客戶端104的用戶能夠通過其向信息伺服器系統130提交服務請求並從信息伺服器系統130接收搜索結果或其它服務的任意計算機或類似設備。示例包括臺式計算機、膝上計算機、平板計算機、諸如行動電話的行動裝置、個人數字助理、機頂盒,或者以上的任意組合,但是並不局限於此。各客戶端104可以包含至少一個用於向信息伺服器系統130提交請求的客戶端應用106。例如,客戶端應用106可以是web瀏覽器或者允許用戶在網站102進行搜索、瀏覽和/或使用信息(例如,網頁和web服務)的其它類型的應用。在一些實施例中,客戶端104包括一個或多個客戶端助理108。該客戶端助理108可以是執行與 協助用戶關於客戶端應用106和/或其它應用的活動相關的一個或多個任務的軟體應用。例如,客戶端助理108可以協助客戶端104處的用戶瀏覽網站102所託管的信息(例如,文件),處理從信息伺服器系統130所接收的信息(例如,搜索結果),並且監視用戶針對搜索結果的活動。在一些實施例中,客戶端助理108被嵌入在一個或多個網頁(例如,搜索結果網頁)或者從信息伺服器系統130下載的其它文檔中。在一些實施例中,客戶端助理108是客戶端應用106的一部分(例如,web瀏覽器的插件)。通信網絡120可以是有線或無線的區域網(LAN)和/或廣域網(WAN),諸如內聯網、外聯網、網際網路,或者這些網絡的組合。在一些實施例中,通信網絡120使用超文本傳輸協議(HTTP)和傳輸控制協議/網際網路協議(TCP/IP)在不同網絡之間傳輸信息。HTTP允許客戶端設備經由通信網絡120訪問可在網際網路上獲得的各種信息。然而,本發明的各個實施例不局限於使用任何特定的協議。如該說明書通篇使用的術語「信息項」是指可經由內容位置標識符(例如,URL)進行訪問的任意信息片段或服務,並且例如可以是網頁、包括多個網頁的網站、文檔(例如,圖片、圖像、繪圖、書籍、XML文檔、文字處理文檔、電子表單文檔、展示文檔,或者可以使用搜尋引擎進行索引並且被用於搜索的任意其它文檔)、視頻/音頻流、資料庫或資料庫記錄、計算對象、搜尋引擎,或者其它在線信息服務。在一些實施例中,信息伺服器系統130包括前端伺服器122、查詢處理器124、搜尋引擎126、簡檔管理器128、信息分類器136、查詢日誌資料庫140、用戶簡檔資料庫132、信息分類種子資料庫138和信息分類資料庫134。在一些實施例中,信息伺服器系統130還包括查詢簡檔資料庫142,而在其它一些實施例中,由於在查詢簡檔被用來跨相應查詢的搜索結果「傳播」分類信息之後不被保留而並不需要該資料庫142。信息伺服器系統130從客戶端104接收查詢,對所述查詢進行處理以產生搜索結果,並且將所述搜索結果返回進行查詢的客戶端104。(由進行請求的客戶端104或者客戶端104處的相應請求者所發送的)相應查詢的搜索結果至少部分地基於來自信息分類資料庫134的信息分類數據以及從用戶簡檔資料庫132所獲得的查詢請求者的用戶簡檔而被進一步處理以產生要返回給進行請求的客戶端104的搜索結果的有序集合。前端伺服器122被配置為從客戶端104接收查詢。該查詢由搜尋引擎126和查詢處理器124進行處理以產生搜索結果的集合。查詢處理器124被配置為使用信息分類資料庫134中所存儲的分類數據以及用戶簡檔資料庫132中所存儲的用戶簡檔信息來確定用於顯示的搜索結果的順序。可選地,查詢處理器124被實現為搜尋引擎126的一部分;可替選地,查詢處理器124被實現為單獨的伺服器或伺服器集合。在從信息伺服器系統130接收了搜索結果之後,客戶端104向用戶顯示所述搜索結果。在一些實施例中,客戶端助理108監視用戶針對搜索結果的活動並且生成相應的搜索結果使用數據。所述搜索結果使用數據可以包括以下的一個或多個用戶對一個或多個搜索結果的選擇(也被稱作「點擊」數據)、選擇持續時間(用戶選擇搜索結果中的URL連結和用戶從搜索結果文檔退出或者選擇搜索結果中另一個URL連結之間的時間量),以及關於搜索結果的指示器活動。在一些實施例中,所述搜索結果使用數據被發送到信息伺服器系統130,並且連同閃現(impression)數據一起存儲在查詢日誌資料庫140中以更新用戶簡檔資料庫132和信息分類資料庫134。典型地,關於歷史搜索查詢的閃現數據包括所列出的每個搜索結果的一個或多個分值,諸如信息檢索分值,以及指示搜索查詢的搜索結果的順序或者等同地每次搜索在搜索查詢的搜索結果集合中的位置的位置數據。查詢日誌資料庫140存儲歷史查詢信息,對於各查詢而言,所述歷史查詢信息包 括查詢的查詢詞語(206,圖2A)、搜索結果(210-1,圖2A)、閃現數據(例如,搜索結果的一個或多個信息檢索(IR)分值和(指示所顯示的搜索結果的順序的)搜索結果的位置數據,以及搜索結果的點擊數據(搜索結果的用戶選擇))。在一些實施例中,關於各查詢的存儲在查詢日誌資料庫140中的歷史查詢信息還包括搜索結果的用戶導航統計數據。可選地,各查詢的歷史查詢信息進一步包括其它信息,諸如搜索請求者的位置信息(例如,城市、州、國家或地區)以及查詢語言。其信息被存儲在查詢日誌資料庫140中的查詢是來自用戶群體的查詢,諸如對應搜尋引擎126的所有用戶。在一些實施例中,所述系統包括多個查詢日誌資料庫,或者查詢日誌資料庫140被分區,其中每個查詢日誌資料庫或分區存儲與從相應用戶群體接收的查詢相對應的記錄,所述用戶群體諸如以特定語言(例如,英語、日語、中文、法語、德語等)提交查詢的所有用戶,從特定國家或其它司法管轄區或者從特定IP位址範圍提交查詢的所有用戶,這些標準的任意適當組合。用戶簡檔資料庫132存儲多個用戶簡檔,每個用戶簡檔對應於相應的用戶。在一些實施例中,用戶簡檔包括多個子簡檔,每個子簡檔依據預定義的標準對用戶的相應方面進行分類。在一些實施例中,用戶簡檔對應於用戶組(例如,共享特定客戶端104的用戶,或者從特定網站或網頁訪問搜尋引擎的所有用戶)。用戶簡檔資料庫132至少可由查詢處理器124和簡檔管理器128訪問。簡檔管理器128創建並維護信息伺服器系統130的用戶的至少一些用戶簡檔。如以下更為詳細描述的,簡檔管理器128使用查詢日誌資料庫140中所存儲的用戶的搜索歷史來確定用戶的搜索興趣。信息分類資料庫134存儲網際網路上各種信息項的分類數據,並且至少可由查詢處理器124和信息分類器136訪問。如以下結合圖5A所討論的,信息分類器136被配置為對信息項進行分類或歸類並且將分類數據存儲在信息分類資料庫134中。在一些實施例中,信息分類器136使用查詢日誌資料庫140中所存儲的歷史查詢信息(例如,閃現數據和結果使用數據)和信息分類種子資料庫138中所存儲的一些分類信息項的分類種子數據為那些還沒有分類的信息項生成分類數據。信息分類器136依賴於查詢日誌資料庫140中的歷史查詢信息來構建並維護信息分類資料庫134。如以下將參考圖3C所描述的,信息分類器136還被配置為使用信息分類資料庫134中的分類數據和歷史查詢信息來生成用戶簡檔信息。圖2A圖示了依據一些實施例的用於存儲涉及用戶集合的歷史查詢信息的數據結構200。數據結構200包括多個查詢記錄202-1-202-N,每個記錄對應於相應用戶在相應時間從相應位置提交的信息伺服器系統130針對其維護查詢相關信息的查詢。在一些實施例中,查詢記錄202可以包括以下中的一個或多個用戶ID (識別提交與記錄202相對應的查詢的用戶)和會話ID 204 ;查詢的查詢詞語206 ;以及包括表示所述查詢的搜索結果的多個URL ID (例如,210-1...210-Q)的查詢歷史信息208,以及關於搜索結果中的URL ID的附加信息(212-1. . . 212-Q)。在一些實施例中,相應查詢的查詢記錄202僅存儲前Q個(例如,40或50個)搜索結果的信息,即使查詢可能生成數目遠大於此的搜索結果。在一些實施例中,查詢歷史信息中相應URL ID的附加信息包括URL的閃現數據(例如,IR(信息檢索)分值,其是URL與查詢的相關度的量度,以及URL在搜索結果中的位置);URL的導航率(URL的用戶選擇和諸如查詢提交之前的一周或一個月的特定時間段內針對相同查詢的搜索結果中所有URL的用戶選擇之間的比率);以及指示URL是否被用戶 在所有URL中選擇的點擊數據。注意,URL的導航率指示其在已經提交相同查詢的用戶之間關於其它URL的流行度。可選地,與URL相關聯的附加信息識別包含該URL的信息項,諸如其它網頁、圖像、視頻、書籍等。在一些實施例中,查詢記錄202還包括查詢的地理和人口統計信息,如提交查詢的國家/地區以及查詢的語言。例如,對於從不同國家或者在不同時間提交的相同查詢詞語集合,搜索結果可能有所不同。如以下將會解釋的,查詢日誌資料庫中的信息可以被用來對大量URL生成準確的分類數據。用戶ID 204是用於識別提交查詢的用戶(有時是客戶端)的唯一標識符。在許多實施例中,為了保護系統用戶的隱私,用戶ID 204唯一地識別用戶或客戶端,但是不能被用來識別用戶的姓名或其它識別信息。這同樣應用於以下關於圖2D所討論的用戶簡檔記錄242的用戶ID244。在一些實施例中,在用戶第一次登錄到信息伺服器系統或者在之前的會話期滿之後再次登錄到系統時,在客戶端104和信息伺服器系統130之間建立網絡通信會話。在任一種情況下,都為會話創建唯一的會話ID 204,並且其成為查詢記錄202的一部分。查詢詞語206可以是用戶原始提交的那些詞語或者被規格化為伺服器系統所採用的格式的那些詞語。對於每個查詢,信息伺服器系統130識別對應於該查詢的一組搜索結果。典型地,搜索結果包括URL(或IP位址)、來自URL所識別的網頁的文本摘錄以及其它輔助項。搜索結果的集合依據它們對於查詢的相應相關度進行排序,以使得更加相關的結果在較不相關的結果之前顯示。例如,如果存在每頁顯示不超過10個結果的限制,則45個搜索結果的集合被劃分為5個結果頁面。在第一頁面上顯示的結果被認為與第二頁面上的結果相比與查詢更加相關並且因此被首先顯示。在一些實施例中,所顯示的搜索結果頁面也被稱作搜索結果的閃現。在一個結果頁面或者搜索結果的一個閃現內,處於瀏覽器窗口頂端或頂端附近的位置被保留給更為相關的結果,這是因為其通常比窗口中的其它地方受到更多關注。在客戶端104,客戶端助理108監視用戶針對所顯示的搜索結果的活動,諸如用戶訪問的閃現、用戶花費在不同搜索結果上的時間量(例如,通過追蹤用戶光標在搜索結果上的位置)以及用戶所點擊的URL連結。該用戶交互信息以及表徵搜索結果使用的其它數據被發送回信息伺服器系統130並且連同相應的URL ID 210 一起存儲在數據結構200中(在查詢歷史信息208中)。圖2B描繪了依據ー些實施例的用於存儲查詢簡檔的示例性數據結構220的框圖。與圖2A的數據結構類似,數據結構220包括多個查詢簡檔記錄214-1至214-P,其中的每ー個對應於ー個用戶所提交的查詢。當許多用戶提交了相同的查詢時,單個查詢簡檔214存儲該查詢的簡檔信息。在一些實施例中,每個查詢簡檔記錄214包含識別特定查詢的查詢ID 215、查詢中的相應查詢詞語集合216以及用於對查詢分類的類別列表217。可選地,查詢簡檔214可以被分配整體查詢權重221,其不僅反映類別列表217中類別權重的總和,而且還反映指示查詢簡檔有多可靠或者查詢簡檔與查詢結果的簡檔關聯多強的ー個或多個附加因素或量度。這在以下更為詳細地進行討論。在一些實施例中,類別列表217包括一個或多個配對(類別ID 218,權重219)。類別ID 218可以對應於特定類型的信息,諸如新聞、體育、旅行、金融等,而權重219是衡量查詢和相應信息類型之間的相關性的數字。例如,查詢詞語「golf (高爾夫)」可能對於體育 和運動商品的類別具有相對高的權重,而對於信息技術(IT)的類別則具有低權重。在ー些實施例中,類別ID 218對應幹「概念集群」,其可以通過集群過程產生,例如,其可以或可以不被輕易標記以類別名稱。如以下將結合圖3A進ー步描述的,信息分類器136從查詢日誌資料庫140中的歷史查詢信息以及來自信息分類種子資料庫138的分類數據來構建查詢簡檔。在以下所描述的ー些實施例中,生成、使用並接著處理單獨的查詢簡檔214而並不在資料庫或其它收集性數據結構220中存儲查詢簡檔。圖2C是依據一些實施例的用於存儲信息項集合的分類數據的示例性數據結構240的框圖。數據結構240的一個實例可以被用來存儲信息分類種子資料庫138的分類數據,而該數據結構240的另ー個實例可以被用來存儲信息分類資料庫134的分類數據。數據結構240包括多個分類數據記錄222-1至222_N(這裡也被稱作URL簡檔記錄或文檔簡檔記錄),其中每ー個對應於網際網路上的信息項(例如,網頁或網站)。在ー些實施例中,每個分類數據記錄222包含諸如URL 224的信息項定位符、一個或多個屬性(例如URL文本、錨標籤、頁面排名等)、用於對信息項進行分類的類別列表228,並且可選地用於對信息項進行分類的其它簡檔230。類別列表228包括ー個或多個(類別ID 228,權重229)的配對。如以下將結合圖3B進ー步描述的,信息分類器136使用來自查詢日誌資料庫140的歷史查詢信息以及來自查詢簡檔資料庫142的查詢簡檔為信息項生成分類數據。圖2D是依據一些實施例的用於存儲用戶集合的用戶簡檔的示例性數據結構260的框圖。數據結構260包括多個用戶簡檔記錄242-1至242-P,其中每個對應於信息伺服器系統130的特定用戶(或者如以上所描述的用戶組)。在一些實施例中,每個用戶簡檔記錄242包括用戶ID244和類別列表248,所述類別列表248包括表示用戶搜索興趣的一個或多個(類別ID 249,權重250)的配對。可選地,用戶簡檔記錄242包括一個或多個定製偏好246(例如,喜好標題、捜索結果的優選排序),其可以由用戶手工指定(例如,使用為此所配置的web表單)。此外,用戶簡檔記錄242可以可選地包括從不同方面對用戶的捜索興趣進行分類的其它類型的用戶簡檔。這些用戶簡檔可以由簡檔管理器128生成以在需要時補充或替代類別列表248。
注意,一個網頁或查詢或用戶的類別列表可能與另ー個的不同。例如,一個網頁可以具有體育類別和相應的權重,而另ー個網頁可能與體育完全無關並且因此可能在每個類別列表中具有完全不同的類別集合。在一些實施例中,不同網頁、查詢和用戶的分類數據被規範化以使得對於不同實體的類別列表中出現的相同類別,它們各自的權重是可比較的。因此,當第一用戶的簡檔對於相應類別比第二用戶的簡檔具有較高的權重吋,這指示第一用戶比第二用戶對該相應類別的興趣水平更高。通常,諸如網站或網頁之類的信息項或用戶可能通過多個簡檔(230,252)和/或類別列表(228,248)進行分類。不同的簡檔和類別列表可以從不同角度表徵相同的主題,並且因此具有不同的用途。為了簡要和說明,本發明的實施例假設信息項對應於由URL唯一識別的網頁。貫穿該說明書,諸如「分類數掘」、「簡檔」、「類別列表」、「集群」等的術語可互換使用,其中每ー個可以數學地表示為稀疏矢量。網頁的分類意味著為該網頁生成類別列表。但是如背景技術部分中所指出的,許多網頁是未分類或錯誤分類的。因此,本發明的ー個方面是如何將分類網頁的分類數據(例如,存儲在信息分類種子資料庫138中的數據)「傳播」到那些未分類的網頁或網站上以為所述未分類的網頁或網站生成準確的分類數據。注意,這種傳播分類數據的過程不要求未分類網頁的內容的先驗知識並且因此在計 算上是聞效的。在一些實施例中,從分類網頁向未分類網頁傳播分類數據的過程涉及兩個步驟
(i)從分類網頁向與分類和未分類網頁兩者相關的查詢傳播分類數據;和(ii)從查詢向未分類網頁傳播分類數據。注意,術語「傳播」從分類數據提供者的角度描述該過程,所述分類數據提供者即最初分類的信息項。但是從分類數據接收者的角度來看,即從最初未分類的信息項的角度來看,該過程是兩步驟的聚集操作(i)將來自不同的分類網頁的分類數據的加權貢獻聚集到與該查詢的分類數據相同的查詢;和(ii)將來自不同查詢的分類數據的加權貢獻聚集到與該網頁的分類數據相同的未分類網頁。圖3A和3B是更詳細圖示兩步驟過程的流程圖。具體地,圖3A是圖示依據ー些實施例的用於構建查詢簡檔資料庫142的示例性方法300的流程圖。該方法使用來自查詢日誌資料庫140的歷史查詢信息以及來自種子資料庫138的分類數據對多個用戶在ー個時間段(例如,過去六個月)內所提交的查詢集合建立簡檔。這裡所描述的每種方法可以通過指令進行管理,所述指令存儲在計算機可讀存儲介質中並且由ー個或多個伺服器或客戶端的ー個或多個處理器執行。此外,圖3A-3C中所示的每個操作可以對應於計算機存儲器或計算機可讀存儲介質中存儲的指令。在一些實施例中,歷史查詢信息包括查詢詞語、對應於查詢詞語的搜索結果、搜索結果的閃現數據(例如,分值、位置數據)以及追蹤用戶與捜索結果的交互的信息(諸如點擊數據)。分類種子數據包括多個稀疏矢量,其中每ー個提供特定網頁(或網站)的集群信息。這些稀疏矢量是網頁與各種主題、標題或概念集群的相關度的最初估計。可以使用本領域的許多已知方法(例如,網頁內容、關鍵詞語和/或連結的分析)來生成這些稀疏矢量。作為最初估計,這些稀疏矢量可以不是完全準確或完整的。如以下將要描述的,生成分類數據的兩步驟過程在一些實施例中可以是迭代過程。分類數據的迭代傳播不僅能夠為未分類的網頁生成分類數據,而且還能夠對包括其數據已經被用作種子數據的那些最初分類的網頁在內的先前分類的網頁的分類數據進行更新。
來自被用來為URL集合生成分類數據的查詢日誌資料庫140的歷史查詢信息對應於來自用戶群體的歷史查詢。所述用戶群體可以是與查詢日誌資料庫140相關聯的搜尋引擎的所有用戶,或者其可以是該搜尋引擎的所有用戶的子集,諸如以特定語言提交查詢的用戶,來自特定司法管轄區或地理區域的用戶,從特定IP位址範圍提交查詢的用戶,或者這些標準的任意適當組合。使用從查詢日誌資料庫140檢索(302)的查詢日誌信息以及從種子資料庫138檢索(304)的分類數據作為輸入,信息分類器136為用戶所提交的查詢生成(306)查詢簡檔。為了說明,本文描述了其中種子資料庫138中的分類數據是用於多個URL的分類數據的實施例。然而,在其它實施例中,種子分類數據不局限於用於URL的分類數據。例如,資料庫138中的種子分類數據可以包括用於網站的分類數據(與URL級別的分類數據相比,其可以被稱作網站級別的分類數據)。只要種子分類數據合理地準確並且有足夠數量的查詢日誌數據,信息分類器136就能夠準確並廣泛地傳播種子分類數據從而為大量還沒有通過傳統方法準確建立簡檔的URL生成分類數據。首先,信息分類器136在查詢日誌資料庫140中選擇(具有查詢詞語集合的) 查詢日誌記錄。對於相應查詢,信息分類器識別(308-1)捜索結果以及對應於捜索結果的URL。如果相同的查詢出現在表示來自不同用戶和不同時間的不同搜索請求的多個查詢日誌記錄中,則在相應的搜索結果之間可能存在差異。在一些實施例中,通過將搜索結果分組到ー起並且對相應的查詢日誌進行分析,信息分類器選擇其相關聯的網頁被認為與查詢相關的URL集合。注意,由於三個術語之間ー對一的映射,術語「URL」、「網頁」和「捜索結果」經常貫穿說明書可互換地使用。在為所處理的查詢日誌記錄識別了 URL集合(308-1)之後,信息分類器136對所識別的URL的分類應用(308-2)加權標準。所述加權表徵用於估計每個URL與查詢的相關度。在一些實施例中,所述加權標準包括URL的IR分值、導航率、閃現、位置和點擊數據。這些加權標準被用來確定對應於URL與查詢的相關度的權重(或分值)。例如,出現在與特定查詢相對應的捜索結果頂端或頂端附近的URL被認為與出現在搜索結果較低位置的其它搜索結果相比與所述查詢更加相關。類似地,具有高導航率的URL,即歷史上以高比率被提交相同查詢的用戶選擇的URL,在考慮其與查詢的相關度時被給予與(在搜索結果的類似位置的)具有較低導航率的URL相比更大的權重。因此,URL的種子分類數據被認為與查詢高度相關並且因此在生成查詢簡檔時被給予更大權重。在一些實施例中,少數最為相關的URL(例如,搜索結果的第一頁面前兩個、三個或四個URL)被給予完整權重I,而那些較不相關的URL的權重則作為其相應搜索結果位置、IR分值、導航率、點擊數據以及還有潛在的其它特定於URL的參數的函數而逐漸減小。如以上所提到的,可以使用點擊數據來修改基於搜索結果位置向URL分配的權重。例如,已經被用戶選擇觀看的搜索結果可以被分配最高的可能權重(例如,與最高排名的搜索結果相同的權重)。可替選地,已經被用戶選擇觀看的搜索結果的權重可以被給予預定的提升(例如,作為固定増加或百分比増加);可選地,可以應用上限來限制所產生的權重以使其不超過預定義的最大權重。接下來,信息分類器將URL的加權分類數據聚集(308-3)為查詢自己的分類數據,即查詢的簡檔。由於先前的加權步驟,查詢的簡檔應當與具有更高權重的那些URL的分類數據更加類似。注意,(捜索結果中的)不存在其種子分類數據的URL對於查詢的簡檔沒有影響。雖然將分類數據從URL傳播到查詢的這個過程可能並沒有明確考慮URL所識別的網頁的內容以及它與查詢的相關度,但是應當注意的是,諸如搜索結果的閃現數據(例如,IR分值、位置數據)和點擊數據的歷史查詢信息已經包括了網頁內容的影響。如以上所討論的,在生成查詢簡檔時,聚集操作308-3僅使用了來自已經被分類的URL的分類,並且因此在種子資料庫138中具有分類數據。然而,在一些實施例中,在查詢簡檔分類過程300的後續迭代中,查詢分類過程的「種子數據」可以是在URL分類過程320的較早迭代期間所分類的URL的分類數據(在以下描述)。換句話說,在查詢分類過程300的後續迭代期間,種子資料庫138可以被在URL分類過程320的較早迭代期間所生成的信息分類資料庫134 (或者該資料庫的子集)替代。最後,在一些實施例中,信息分類器將所生成的查詢簡檔存儲(310)在查詢簡檔資料庫142中。在這些實施例中,如以上結合圖3A所描述的,傳播過程首先從分類URL的分類數據生成查詢簡檔,並接著從所述查詢簡檔生成未分類URL的分類數據,如以下結合圖3B所描述的。 在其它實施例中,在生成每個查詢簡檔之後,該查詢簡檔的加權副本(例如,對應於所述查詢簡檔的查詢日誌記錄中所列出的每個搜索結果的加權副本)被寫入中間結果表(720,圖7)中的條目。可選地,當不再需要向與相應查詢日誌記錄相關聯的URL傳播信息時,查詢簡檔不被存儲在查詢簡檔資料庫中。在這些實施例中,在所有的查詢日誌記錄都已經被處理之後,所述中間結果表中每個URL的條目被聚集以產生已經將其充分的分類信息寫入所述中間結果表的每個URL的相應簡檔。這些實施例的控制流程表示在表I中提供。具體地,在第一階段,對每個查詢日誌記錄進行處理以產生查詢簡檔,並接著通過對查詢日誌記錄中所列出的每個URL (或者可替選地,查詢日誌記錄中所列出的URL的所識別主題中的每個URL)在中間結果表中產生條目來「傳播」所述查詢簡檔。(用於被處理的查詢日誌記錄的)在中間結果表中存儲的每個條目對應於查詢記錄中所列出的搜索結果的特定URL,並且包含所述查詢簡檔的加權版本。如以上更為詳細解釋的,在對應於特定URL和特定查詢的條目中,給予所述查詢簡檔的權重是基於URL與查詢的相關度。在第二階段,在中間結果表已經被填充來自查詢日誌記錄處理的條目之後,每個URL的條目被聚集以產生該URL的分類數據,並且對每個URL所產生的分類數據被存儲在分類資料庫中。如另外更為詳細解釋的,如果用於URL的條目的數目小於閾值,或者其它質量標準沒有得到滿足,則用於URL的分類數據不被生成或者不被存儲在分類資料庫中。表IIl 第一階段 Il對於每個查詢日誌記錄{通過對查詢日誌記錄中列出的URL的種子分類數據進行聚集來生成查詢簡檔(見圖3A的描述);可選地,查詢簡檔不存儲在查詢簡檔資料庫中;對於查詢日誌記錄中列出的每個URL (可替選地對於查詢日誌記錄中列出的URL的識別子集中的每個URL) {在中間結果表中生成條目(以URL為鍵),其是用於查詢日誌記錄的查詢簡檔的加權版本(見操作328-5的描述,圖3B);}}// 第二階段 Il對於中間結果表中的每個不同URL{聚集用於該URL的加權查詢簡檔以生成用於URL的分類數據(見操作328_6的描述,圖3B);將用於URL的分類數據存儲在信息分類資料庫中(見操作330的描述,圖3B)
} 在任意這些實施例中,為URL生成分類數據的過程可以對查詢日誌記錄中列出的所有URL執行,包括分類和未分類的URL,或者可替選地,該過程可以僅對未分類URL生成分類數據(在這樣的情況下,用於分類URL的種子分類數據仍然為那些URL的分類數據)。可替選地,可以基於各種選擇標準對查詢日誌記錄中列出的URL的其它子集生成分類數據。現在參見圖3B,至少部分基於從查詢日誌資料庫140檢索(322)的查詢日誌信息以及從查詢簡檔資料庫142檢索(324)的查詢簡檔,信息分類器136生成/更新(326)通過搜索結果中找到的URL所識別的頁面的分類數據。首先,信息分類器136從查詢日誌資料庫140識別(328-1)查詢集合以及相應的查詢歷史。注意,該查詢集合可以是信息分類器136先前所識別的相同查詢集合,並且每個查詢在查詢簡檔資料庫142中具有相關聯的查詢簡檔。每個查詢與多個搜索結果相關聯,其中ー些被分類(例如,在種子資料庫138中具有分類數據)而ー些則沒有。信息分類器136接著從查詢簡檔資料庫142識別(328_2)對應於查詢集合的查詢簡檔。這些查詢簡檔被用於生成/更新搜索結果中找到的至少ー些URL的分類數據。如以上所提到的,至少部分地基於對應於相同查詢的不同捜索結果集合中的不同URL的分類數據來構建查詢簡檔。但是它們的貢獻可以根據每個URL與特定搜索結果集合中的查詢的相關度而發生變化。如以上所提到的,用於產生查詢簡檔而對URL分類數據進行的聚集依據查詢的搜索結果中的URL的IR分值、導航率、搜索結果位置和點擊數據而被加以權重。相互地,URL的分類數據可以至少部分地從其中列出URL作為搜索結果的查詢的簡檔得出。在一些實施例中,這些查詢簡檔對於URL的分類數據的貢獻取決於如查詢的搜索結果位置數據和點擊數據所指示的URL與每個查詢的相關度。例如,假設URL出現在對應於兩個不同查詢A和B的捜索結果中。對於查詢A,URL出現在搜索結果的頂端並且還被用戶選擇;對於查詢B,相同的URL位於搜索結果的第五頁並且從未被用戶選擇和觀看。這樣的加權信息從相應的查詢日誌信息識別(328-3)或得出。當確定兩個查詢簡檔對於URL的分類數據的貢獻時,假設與兩個查詢相關聯的任何其它加權因素基本相同,則信息分類器136對它們應用(328-4)加權標準以使得查詢A的簡檔被給予高於查詢B的簡檔的權重。在一些實施例中,信息分類器136將加權的查詢簡檔存儲(328-5)在中間結果表中。對於給定的URL,中間結果表中的每個條目表示ー個加權的查詢簡檔對於該URL的分類數據的貢獻。在該表中的查詢ID和URL ID之間存在多對多的映射。對於給定查詢ID,可以在表中找到ー組URL ID,每個URL ID對應於查詢簡檔的加權版本。對於給定URLID,能夠在表中找到ー組條目,URL ID出現在其捜索結果中的每個查詢都有ー個條目。以另ー種方式來講,操作328-5通過以下來執行對於日誌中的每個查詢,將搜索結果中每個URL的條目存儲到中間結果表中;所述條目包括所述查詢的查詢簡檔中的類別列表的加權版本。對於查詢日誌中的每個查詢重複該操作,由此在中間結果表中生成非常大量的條目。接著,通過以下執行聚集操作328-6 :對於中間結果表中的每個不同URL,聚集中間結果表中的所有條目。在一些實施例中,URL的聚集分類數據被規範化,以使得I)對於不同URL的類別列表中出現的相同類別,它們各自的權重是可比較的;並且2) URL出現在搜索結果中的查詢的總數對於該URL的分類數據(類別列表)中的類別權重的強度影響很小或沒有影響。例如,作為規範化的結果,出現在查詢日誌中的100個查詢的結果中的URL的類別權重總和不低於出現在查詢日誌中的500個查詢的結果中的URL的類別權重總和。在一些實施例中,如果其中出現URL的查詢的總數低於預定閾值,則由於沒有足夠的數據來產生充分可靠的URL而不產生該URL的簡檔。注意,查詢權重或加權因素與中間結果表中的每個條目相關聯,其基於查詢簡檔的總權重以及條目的URL和查詢之間的連結強度。當對相應URL的分類數據進行聚集(328-6)時,在確定URL簡檔222中的類別的最終權重229 (圖2C)吋,對 應於URL的表條目的查詢權重總和被用作規範化因數(例如,作為除數)。 此外,在一些實施例中,當通過聚集操作328-6所產生的相應URL的類別228 (圖2C)的列表包含多於預定數量的不同類別時,該列表被截短或過濾從而在排除掉最低權重的類別ID的同時保留具有未過濾類別列表中的類別的總權重的至少預定百分比(例如,90% )的最高權重的類別ID。在聚集操作328-6完成時,用於每個URL的分類數據被存儲(330)在信息分類資料庫134中。如以上所解釋的(見表I以及表I所示的控制流程的描述),在一些實施例中,以逐個查詢記錄為基礎來執行以上所提到的將分類數據從分類URL傳播到未分類URL的過程,而不產生查詢簡檔資料庫。在一些實施例中,與查詢記錄相關聯的查詢詞語的數目也被納入到加權以及分類數據從查詢簡檔到相應查詢記錄的捜索結果中所列出的URL的傳播的因素之中。通常,查詢具有的詞語越多,查詢就更加特定,並且搜索結果關於主題性就更為集中。相反,查詢所具有的詞語越少,該查詢就越模糊並且搜索結果就更加可能包括關於不同主題的結果。例如,對應於「jaguar(美洲虎)」的單個詞語的查詢的搜索結果包括http://www. jaguar,com/global/default, htm,這是Jaguar品牌的豪華汽車的官方網站,並且包括http://en. wikipedia. org/wiki/Jaguar,這是與被稱作美洲虎的大型貓科動物相關的維基百科網頁。與之相比,對應於兩個詞語的查詢「jaguar car」的搜索結果仍然包括Jaguar品牌豪華汽車的官方網站。但是這些搜索結果將不包括與被稱作美洲虎的大型貓科動物相關的網頁,但是相反會包括與汽車的Jaguar品牌相關的其它搜索結果,諸如http://en. wikipedia. org/wiki/Jaguar_Cars,這是與Jaguar汽車品牌的歷史相關的維基百科網頁。在一些實施例中,查詢的分類數據(也被稱作查詢簡檔)對於查詢的搜索結果中所列出的URL的分類數據的貢獻依據該查詢中的查詢詞語的數目而被加以權重。例如,一個單詞(或者以ー些亞洲語言的一個字符)的查詢的臨時分類數據被給予最低權重。查詢所具有的單詞或字符越多,對其分類數據所分配的權重就越高。因此,關於特定查詢,在該查詢包含多個詞語時,在中間結果表中用於特定URL的條目將具有該查詢的分類數據的較高權重的副本,並且在該查詢僅包含單個詞語時將具有該查詢的分類數據的較低權重的副本。根據特定語言,查詢長度在對分類數據加權中的角色在其達到最小閾值(例如,英語和其它ー些語言中的兩個或三個單詞)時變得較不重要。查詢的模糊性或特定性的其它量度包括相應分類數據的分布。對於例如「jaguarcar」的特定查詢,捜索結果的大部分(如果不是全部)應當被限制為ー個主題,即豪華汽車品牌。結果,從相應捜索結果的分類數據所得出的該查詢的臨時分類數據將集中於相同的主題。與之相比,如「 jaguar」的較不特定的查詢應當看到分類數據分布在至少兩個主題上,即豪華汽車品牌和大型貓科動物。另ー種度量查詢的模糊性或特定性的方式是檢查搜索結果中的URL的分類數據的關聯,例如通過對URL的成對餘弦相似度求平均。以另ー種方式來講,捜索結果的平均餘弦相似度對應於捜索查詢的特定性水平(或者作為其量度)。例如,捜索結果的平均餘弦相似度在捜索結果彼此非常相似時(例如,大多數結果涉及單個主要主題)為高,這指示捜索查詢具有高度的特定性。捜索結果越多祥化,平均餘 弦相似度就越小,這指示捜索查詢具有低特定性。類似用戶的瀏覽歷史,用戶的搜索歷史(諸如用戶所提交的查詢以及用戶所選擇的捜索結果)也是對用戶的搜索興趣建立簡檔的良好源。圖3C是圖示基於用戶所選擇的捜索結果URL的分類數據構建用戶簡檔的示例性過程340的流程圖。至少部分基於從查詢日誌資料庫140檢索(342)的查詢日誌信息以及從信息分類資料庫134檢索(344)的分類數據,信息分類器136從查詢日誌資料庫140識別(348-1)相應用戶所提交的查詢集合以及相應的查詢歷史。從所述查詢歷史,信息分類器136識別(348-2)用戶所選擇的搜索結果以及相應的URL。對於每個URL,信息分類器從資料庫134識別(348-4)其分類數據。在一些實施例中,信息分類器136將用戶所選擇的搜素結果URL的分類數據聚集(348-5)到用戶簡檔中。注意,在對URL的分類數據進行聚集時可以使用不同的加權或過濾標準。例如,在一些實施例中,URL被用戶選擇的頻率被納入URL的分類數據的權重的因素。在一些實施例中,當兩個URL具有相似的用戶點擊數時,用戶已經對其證實了持久興趣(例如,ー個月內大約平均傳播了 N次用戶點擊)的URL的分類數據在確定用戶簡檔時被給予比類似的用戶點擊數集中在短時間段中(例如,ー兩個小時)的URL更大的權重。在一些實施例中,還考慮查詢的時間新近度(recency),以使得與較為新近的查詢相關聯的URL的分類數據被給予比與較久遠的查詢相關聯的URL的分類數據更高的權重。在一些實施例中,在對用戶建立簡檔時還考慮特定集群或類別的重要性。例如,包括用戶的個體組的共同集群或類別對於確定用戶興趣的幫助較小並且應當被給予比更為不同的集群或類別更低的權重。所產生的用戶簡檔接著被信息伺服器系統130用來為用戶提供個性化服務。例如,響應於來自用戶的查詢,搜尋引擎126識別搜索結果集合併且所述搜索結果最初通過其與查詢的相關度進行排序。在向進行請求的用戶返回捜索結果之前,查詢處理器124能夠通過將每個捜索結果的分類數據與用戶簡檔相比較來對捜索結果進行重新排序。如果均被表達為稀疏矢量,則可以通過計算兩個矢量的餘弦或點積來確定所述比較。捜索結果接著至少部分基於它們的點積而被重新排序,並且接著被傳送到請求用戶的客戶端設備104,以便在客戶端設備104向請求用戶進行顯示。在一些實施例中,信息分類器136還識別(348-3)用戶所提交的查詢的查詢簡檔,並且將查詢簡檔和用戶所選擇的URL的分類數據聚集(348-5)在用戶簡檔中並且將所產生的用戶簡檔存儲(350)在資料庫132中。注意,以上參考圖3A、3B和3C所描述的三種方法中的任ー種都可以是迭代過程。信息分類器以種子資料庫138中有限數目的URL的分類數據作為開始並且將所述分類數據傳播到查詢簡檔集合、那些未分類URL的分類數據以及用戶簡檔集合中。如圖3A-3C所示,歷史查詢信息在對查詢、URL或用戶建立簡檔時扮演重要角色。傳播分類數據的過程是進行中的過程,隨時間重複或更新,原因在於查詢日誌資料庫持續累積新的查詢日誌信息。新的查詢歷史不僅提供更多數據點來精化URL的分類數據,而且保持了對許多用戶的搜索興趣的動態方面的追蹤。
在一些實施例中,信息分類器136重複以上所描述的過程以更新查詢簡檔資料庫142、信息分類資料庫134和用戶簡檔資料庫132中的ー個或多個。在一些實施例中,選擇信息分類資料庫134的子集作為新的種子資料庫138來傳播分類數據。在一些實施例中,信息分類種子資料庫138由另ー種集群方法生成。在一些實施例中,在開始傳播新ー輪的分類數據之前,信息分類器136可以刷新查詢簡檔資料庫142、信息分類資料庫134或用戶簡檔資料庫142,以使得不保存遺留的分類數據。在一些其它實施例中,如果這些數據記錄被視為仍然可靠和有用,則信息分類器136可以保留查詢簡檔資料庫142、信息分類資料庫134或用戶簡檔資料庫132中的數據記錄的至少子集。在一些實施例中,如果與網站相關聯的網頁的至少子集的分類數據是已知的,則以上所提到的方法可以被用來對網站建立簡檔。這可以通過不同網頁的分類數據的直接聚集來實現。可替選地或除此之外,不同網頁的分類數據依據它們在網站層級中的相應位置以及相應網頁在特定時間段期間的流行度或用戶使用數據被加以權重。以另ー種方式來講,在對網頁分類數據進行聚集以產生網站的簡檔時,可以依據以下對網站內的網頁的分類給予權重1)網站的網頁上的用戶點擊數,或者2)網頁和網站主頁之間的指示器(director)水平的數目,或者其二者。在一些實施例中,與網站的大部分網頁相關聯的集群或類別被給予比與網站的小部分網頁相關聯的集群或類別相對更高的權重。在一些其它實施例中,網站(例如,en. wikipedia. com)中至少最小數量的網頁之間缺少至少ー個共同集群或類別可以防止該網站被分類。圖3D是圖示依據ー些實施例的使用其它信息項的分類數據對信息項進行分類的示例的框圖。出於說明的目的,歷史查詢信息350包括兩個用戶所提交的查詢Ql和Q2。但是在現實中,大量查詢日誌條目被存儲在查詢日誌資料庫140中,每個查詢日誌條目對應於用戶在特定會話期間所提交的查詢。包括ー個或多個查詢詞語的查詢具有相應的查詢結果集合和用戶使用數據。為了簡要,兩個查詢Ql和Q2中的每ー個與三個網頁A、B和C相關聯,每個網頁具有指示該網頁與相應查詢的相關度的權重因數W。如以上所解釋的,所述權重因數會受到相應網頁的內容、其在網際網路上的流行度以及諸如閃現、位置和點進之類的相關聯用戶使用數據影響。在該示例中,假設所述三個網頁中的兩個A和B已經被分類並且其相應的分類數據可以在種子分類數據360中找到。雖然作為搜索結果的一部分,但是網頁C在種子分類數據360中沒有相關聯的分類數據。但是網頁C與網頁A和B —起出現在與Ql和Q2的捜索結果中的事實建議了可能至少基於網頁A和B的種子分類數據來預測網頁C的分類數據。在一些實施例中,該預測的第一歩驟是為Ql和Q2構建分類數據或簡檔,其在此有時被稱作種子分類數據的傳播。如圖3D所示,兩個查詢簡檔370 QP_1和QP_2被定義為所述兩個網頁經相應權重因數調整的分類的函數。該預測的第二步驟是通過將兩個查詢簡檔投影到網頁C的分類數據的域中為未分類的網頁C構建分類數據。由於兩個加權因數Wl (C)和W2(C)至少在ー些方面指示網頁C與所述兩個查詢的相關度,所以這些權重因數被用來 確定相應查詢簡檔對於網頁C的分類數據的貢獻。應當注意的是,圖中以及貫穿說明書的任意地方的數學表達式僅是為了說明的目的。如以上結合圖3A所描述的,還存在其它方式對網頁A和B的分類數據在其各自對查詢簡檔的構成方面的貢獻進行聚集和加權,並且也還有其它的方式對查詢簡檔QP_1和QP_2的分類數據在其各自對網頁C的分類數據的貢獻方面進行聚集和加權。應當注意的是,典型查詢的捜索結果對應於數百或者甚至數千個網頁,並且在由不同用戶提交或者甚至由相同用戶在不同時間提交時,相同的查詢會具有稍微不同的捜索結果集合。通過相同的標誌,相同的網頁可以出現在對應於不同用戶所提交的查詢的不同捜索結果集合中並且能夠獲得不同的用戶響應。圖3D中所示的示例,即兩個查詢簡檔中的每ー個從兩個網頁的分類數據生成並且網頁C的分類數據從兩個查詢簡檔生成,僅是用於說明。在一些實施例中,給定查詢和網頁之間多對多關係的屬性,信息分類器僅使用網頁子集的分類數據來構建查詢簡檔或者使用加權因數來使得一個子集優先於另ー個子集。例如,如果網頁針對其出現在相應搜索結果中的查詢的數目低於預定極限,則該網頁可以在傳播分類數據時被跳過。類似地,信息分類器可以僅考慮查詢子集的簡檔來估計未分類網頁的分類數據,或者可以依據預定的啟發式算法而使得一個子集的權重高於另ー個子集。例如,分類數據從分類網頁向未分類網頁的傳播可以被限制為特定查詢。在一些其它實施例中,傳播的範圍可以被擴展以覆蓋例如相同會話內的不同查詢,或者相同用戶所進行的不同會話,或者相同用戶組所進行的不同查詢。圖4是圖示依據ー些實施例的用於使用用戶簡檔和分類數據處理查詢並且對相應查詢結果進行排序的示例性過程400的框圖。Web門戶伺服器402通過查詢入口接ロ或過程404接收查詢,並且向進行請求的客戶端104發送結果信息(其例如可以通過結果頁面組合過程或模塊406被格式化為網頁)以便在客戶端104進行顯示。所接收的請求由搜尋引擎405進行處理以產生與查詢420相匹配或以其它方式滿足查詢420的捜索結果的集合422。搜尋引擎405可以包括一個或多個查詢處理模塊或過程408,其控制或監瞀對搜索索引分區412的集合搜索文檔或者與查詢420相匹配的其它搜索結果。搜索結果的列表被搜尋引擎返回422,並且該列表中的捜索結果接著根據進行請求的用戶的相應用戶簡檔(來自用戶簡檔資料庫132)和捜索結果的分類數據(來自信息分類資料庫134)進行排序410。包括所排序的捜索結果的結果信息被轉發到結果頁面組合模塊406以便轉換為適於發送到進行請求的客戶端的格式(例如,網頁或XML文檔)。在一些實施例中,搜尋引擎405包含用於執行過程400的所有系統組件。圖5A是圖示依據ー些實施例的用於生成分類數據並且使用所述分類數據提供定製服務的示例性過程500的流程圖。就某個程度而言,該過程500是以上結合圖3A-3C所単獨描述的三個過程的概括。在伺服器系統處,過程訪問(502)查詢的歷史查詢信息以及它們相關聯的搜索結果。例如,所述歷史查詢信息可以對應於查詢日誌資料庫中存儲的查詢歷史。ー些搜索結果對應於最初被分類的信息項而其它對應於最初未分類的信息項。為了簡明,最初被分類的信息項被稱作「第一信息項」,而最初未分類的信息項被稱作「第二信息項」。從信息分類種子資料庫,該過程訪問第一信息項的分類數據。使用所述歷史查詢信息和種子分類數據,該過程生成(504)第二信息項的分類數據並且將所生成的分類數據存儲(506)在諸如圖I的信息分類資料庫134的伺服器系統中。 在一些實施例中,為了對最初未分類的信息項生成分類數據,該過程生成識別(504-1)歷史查詢信息中的查詢集合。查詢的至少子集每ー個具有對應於最初未分類的信息項的相關聯的捜索結果。該過程接著基於第一信息項的分類數據以及查詢集合的歷史查詢信息為姆個查詢生成(504-2)分類數據或查詢簡檔。在一些實施例中,對於每個查詢,所述過程識別對應於查詢的搜索結果集合以及對應於捜索結果集合的第一信息項的集合(例如,圖3A的308-1)。接下來,該過程依據諸如它們的相應預定義信息檢索分值、它們相對應的搜索結果在搜索結果集合中的位置以及表示用戶與相對應搜索結果的交互的信息對所識別的第一信息項的分類數據進行加權(例如,圖3A的308-2)。最後,該過程對所識別的第一信息項的加權分類數據進行聚集以生成查詢的分類數據,也被稱作其查詢簡檔(例如,圖3A的308-3)。使用所識別的查詢的查詢簡檔以及查詢的歷史查詢信息,該過程對最初未分類的信息項生成(504-3)分類數據。在一些實施例中,這包括識別查詢集合(例如,圖3B的328-1)以及從查詢簡檔資料庫檢索相應的查詢簡檔(例如,圖3B的328-2)。對於每個查詢,該過程識別對應於查詢的搜索結果集合(例如,圖3B的328-3)。所述搜索結果集合包括至少ー個與最初未分類的信息項相對應的搜索結果。接下來,該過程依據諸如(如捜索引擎126在處理查詢以生成捜索結果時所生成的)最初未分類信息項的信息檢索分值,其在捜索結果集合中相對應的捜索結果位置以及用戶與相應搜索結果的交互(如果有的話)之類的信息對查詢的分類數據或查詢簡檔進行加權(例如,圖3B的328-4)。最後,該過程對查詢的加權分類數據進行聚集以對最初未分類的(第二)信息項生成分類數據(有時稱作URL簡檔)(例如,圖3B的328-6)。還可以執行相同的過程來為最初已分類的(第一)信息項生成新的分類信息。在為第一和第二信息項構建分類數據之後,該過程能夠使用伺服器系統中所存儲的相應分類數據向多個客戶端設備提供(508)與第一和/或第二信息項相關聯的定製服務。在一些實施例中,該過程使用第一和第二信息項的分類數據生成(508-1)用戶簡檔。響應於來自客戶端設備的用戶對於服務的請求,該過程使用用戶簡檔和相應分類數據定製(508-2)所請求的服務。為了生成用戶簡檔,該過程首先在歷史查詢信息和相應的搜索結果中識別用戶所提交的查詢集合(例如,圖3C的348-1、348-2)。所述搜索結果對應於第一和第二信息項中的ー個或多個。該過程接著識別用戶所選擇的信息項的分類數據並且對用戶所選擇的信息項的分類數據進行聚集(例如,圖3C的348-4、348-5)。在一些實施例中,該過程響應於服務請求執行獨立於用戶的服務。該獨立於用戶的服務生成包括第一和第二信息項中的一個或多個的初始結果。對於該初始結果中的每個信息項,該過程通過將信息項的分類數據與用戶簡檔相比較來確定分值,並且接著依據它們各自的分值對初始結果中的信息項進行重新排序,從而生成定製結果。可以定製的示例性服務包括個性化捜索、面向定向的廣告或活動、以及在線社交網絡中的個體匹配等,但是不局限於此。圖5B是圖示依據ー些實施例的用於使用用戶的用戶簡檔和分類數據為(與信息伺服器系統遠程定位的)遠程客戶端設備的用戶提供個性化捜索結果的示例過程的流程圖。在從相應客戶端設備處的用戶接收到查詢之後(532),該過程首先識別對應於所述查詢 的捜索結果集合(534)。至少ー個捜索結果與第二信息項中的ー個相關聯。該過程訪問信息分類資料庫以獲得用於搜索結果的分類數據(536)。用於相應捜索結果的分類數據識別與相應搜索結果相關的ー個或多個類別(536-1)。接下來,該過程通過將其分類數據與用戶簡檔相比較確定捜索結果的分值(538-1)並且依據所確定的分值將所述搜索結果關於其它搜索結果進行排序(538)。最後,該過程向客戶端設備發送表示經排序捜索結果的至少子集的信息以便在客戶端設備進行顯示(540)。圖6是依據一些實施例的客戶端設備600的框圖。設備600通常包括ー個或多個處理單元(CPU) 602、一個或多個網絡或者其它通信接ロ 610、存儲器612,以及用於對這些組件進行互連的ー個或多個通信總線614。所述通信總線614可以包括對系統組件之間的通信進行互連和控制的電路(有時被稱作晶片組)。客戶端設備600可選地可以包括用戶接ロ 605,例如顯示器和鍵盤。存儲器612可以包括高速隨機存取存儲器,諸如DRAM、SRAM、DDR RAM或其它隨機存取固態存儲器設備;並且還可以包括非易失性存儲器,諸如ー個或多個磁碟存儲設備、光碟存儲設備、快閃記憶體設備或者其它非易失性固態存儲設備。存儲器612可以包括與中央處理單元602遠程定位的大型存儲。存儲器612或者可替選地為存儲器612內的非易失性存儲器設備包括計算機可讀存儲介質。存儲器612或者存儲器612的計算機可讀存儲介質存儲以下元素或者這些元素的子集,並且還可以包括另外的元素 包括用於處理各種基本系統服務並且執行獨立於硬體的任務的過程的作業系統616 ; 用於經由ー個或多個(有線或無線)通信網絡將客戶端104連接到其它伺服器或計算機的網絡通信模塊618,所述通信網絡諸如網際網路、其它廣域網、區域網和城域網等; 客戶端應用620,諸如瀏覽器;和 客戶端助理108(例如,工具條、瀏覽器插件),用於監視用戶的活動;在ー些實施例中,所述客戶端助理或其部分可以被嵌入響應於查詢而返回到客戶端的相應搜索結果網頁中。
圖7是圖示依據ー些實施例的信息伺服器系統700的框圖。系統700總體上包括ー個或多個處理單元(CPU) 702、一個或多個網絡或其它通信接ロ 710、存儲器712以及用於對這些組件進行互連的ー個或多個通信總線714。系統700可選地可以包括用戶接ロ,包括顯示設備和鍵盤。存儲器712可以包括高速隨機存取存儲器,諸如DRAM、SRAM、DDR RAM或其它隨機存取固態存儲器設備;並且還可以包括非易失性存儲器,諸如ー個或多個磁碟存儲設備、光碟存儲設備、快閃記憶體設備或者其它非易失性固態存儲設備。存儲器712可以可選地包括與CPU 702遠程定位的一個或多個存儲設備。存儲器712或者可替選地為存儲器712內的非易失性存儲器設備包括計算機可讀存儲介質。存儲器712或者存儲器712的計算機可讀存儲介質存儲以下元素或者這些元素的子集,並且還可以包括另外的元素 包括用於處理各種基本系統服務並且執行獨立於硬體的任務的過程的作業系統716 用於經由ー個或多個(有線或無線)通信網絡接ロ 710以及ー個或多個通 信網絡將信息伺服器系統130連接到其它計算機的網絡通信模塊718,所述通信網絡諸如網際網路、其它廣域網、區域網和城域網等; 用於處理查詢的搜尋引擎126 ; 用於處理與用戶簡檔相關的數據並且可選地用於構建和/或更新用戶簡檔的用戶簡檔管理器128; 用於構建和維護分類數據的信息分類器136 ; 用於根據捜索結果的分類數據和用戶簡檔信息對搜索結果進行排序的查詢處理器 124 ; 用於存儲用戶簡檔信息的用戶簡檔資料庫132 ; 用於存儲用戶歷史查詢信息的查詢日誌資料庫140 ; 用於存儲分類數據的信息分類資料庫134 ;在ー些實施例中,資料庫134還包括種子分類數據,而在其它實施例中,在伺服器系統700的存儲器中存儲單獨的種子分類資料庫138 ; 用於存儲用戶所提交的查詢的分類數據(或簡檔)的查詢簡檔資料庫142 ;和 中間結果表720。以上所識別的每個元素可以被存儲在ー個或多個先前所提到的存儲器設備中,並且對應於用於執行以上所描述的功能的指令集合。以上所識別的模塊或程序(即,指令集合)無需被實現為単獨的軟體程序、過程或模塊,並且這些模塊的各種子集在各個實施例中可以被組合或以另外的方式重新安排。例如,圖7所示的一些模塊和/或資料庫可以被包含在搜尋引擎126內。在一些實施例中,存儲器612和712可以存儲以上所識別的模塊和數據結構的子集。此外,存儲器612和712可以存儲以上沒有描述的另外的模塊和數據結構。圖6和圖7更意在作為客戶端系統和伺服器系統的各種特徵的功能性描述而並不是這裡所描述實施例的結構性示意。在實踐中,並且如本領域技術人員所認識到的,単獨示出的項目可以進行組合併且ー些項目可以被分離。例如,在圖7中単獨示出的一些項目可以被實現在單個伺服器上,而單個項目可以由ー個或多個伺服器來實現。例如,信息分類器136可以被實現在與伺服器系統700的其它組件不同的伺服器集合上。用來實現伺服器系統700的伺服器的實際數目以及特徵如何在它們之間進行分配將隨實施方式而變化,並且可以部分地根據系統在高峰使用期間以及平均使用期間所必須處理的數據業務量而變化。出於解釋的目的,已經參考特定實施例對以上描述進行了描述。然而,以上的說明性討論並非意在是窮舉的或者將本發明限制為所公開的確切形式。可能鑑於以上教導而進行許多修改和變化。所選擇和描述的實施例是為了對本發明的 原理及其實際應用進行最佳解釋,並且由此使得本領域技術人員能夠利用適合於特定預期用途的各種修改最佳地利用本發明以及各個實施例。
權利要求
1.一種計算機實現的方法,包括 在具有一個或多個處理器以及存儲器的伺服器系統處, 分別訪問用於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息,其中所述第一信息項最初被分類而所述第二信息項最初未被分類; 訪問所述第一信息項的分類數據; 基於所述第一信息項的所述分類數據以及所述歷史查詢信息為所述第二信息項生成分類數據; 將所生成的分類數據存儲在所述伺服器系統中;以及 使用存儲在所述伺服器系統中的相對應分類數據向多個客戶端設備提供與所述第二信息項相關聯的定製服務。
2.如權利要求I所述的計算機實現的方法,其中為最初未分類的信息項生成分類數據包括 識別所述歷史查詢信息中的查詢集合,其中所述查詢的至少子集均具有與所述最初未分類的信息項相對應的相關聯搜索結果; 基於所述第一信息項的所述分類數據以及所述查詢集合的所述歷史查詢信息為所述查詢集合生成分類數據;以及 通過將所述查詢子集的所生成的分類數據進行組合而生成所述最初未分類的信息項的分類數據,所述查詢子集中的每一個具有與所述最初未分類的信息項相對應的相關聯搜索結果。
3.如權利要求2所述的計算機實現的方法,進一步包括 更新所述歷史查詢信息;以及 重複進行下述步驟在所述歷史查詢信息中識別查詢、對所述查詢生成分類數據、以及使用經更新的歷史查詢信息為所述最初未分類的信息項生成分類數據。
4.如權利要求2或3所述的計算機實現的方法,其中為所述查詢集合生成分類數據包括 對於所述查詢的至少子集中的每一個, 識別與該查詢相對應的搜索結果的集合以及與該搜索結果的集合相對應的所述第一信息項的集合; 依據它們的相應預定義的信息檢索分值、它們的相對應搜索結果在該搜索結果的集合中的位置以及與相對應搜索結果的用戶交互信息對所識別的第一信息項的分類數據進行加權;以及 將所識別的第一信息項的加權分類數據聚集為所述查詢的分類數據。
5.如權利要求2或3所述的計算機實現的方法,其中為最初未分類的信息項生成分類數據包括 對於所述查詢子集中的每一個, 識別與所述查詢相對應的搜索結果的集合,其中所述搜索結果的集合包括與所述最初未分類的信息項相對應的至少一個搜索結果; 依據所述最初未分類的信息項的預定義的信息檢索分值、其相對應搜索結果在所述搜索結果集合中的位置以及與相對應搜索結果的用戶交互信息對所述查詢的分類數據進行加權;以及 將所述查詢子集的加權分類數據聚集為所述最初未分類的信息項的分類數據。
6.如權利要求1-5中任一項所述的計算機實現的方法,其中所述歷史查詢信息包括用於用戶群體所提交的查詢的歷史查詢信息。
7.如權利要求1-6中任一項所述的計算機實現的方法,其中提供定製服務包括 從相應客戶端設備處的用戶接收查詢,其中所述用戶具有相關聯的用戶簡檔;並且 通過以下步驟對所述查詢進行響應 識別與所述查詢相對應的搜索結果的集合,其中所述搜索結果中的一個與所述第二信 息項中的一個相關聯; 通過將所述第二信息項的所存儲的分類數據與所述用戶簡檔相比較來確定所述搜索結果的分值; 依據所確定的分值將所述搜索結果關於其它搜索結果進行排序;以及 向所述客戶端設備提供表示至少經排序的搜索結果的數據。
8.如權利要求1-6中任一項所述的計算機實現的方法,其中提供定製服務包括 在所述歷史查詢信息中識別用戶所提交的查詢集合以及相對應的搜索結果,其中所述搜索結果對應於所述第一和第二信息項中的一個或多個; 通過聚集所述一個或多個信息項的分類數據為用戶生成用戶簡檔; 將所生成的用戶簡檔存儲在所述伺服器系統中;以及 響應於來自客戶端設備處的用戶對服務的請求,使用所存儲的用戶簡檔定製所請求的服務。
9.如權利要求8所述的計算機實現的方法,其中定製所請求的服務包括 響應於服務請求準備獨立於用戶的服務,其中所述獨立於用戶的服務包括所述第一和第二信息項中的一個或多個; 通過將所述信息項的分類數據與所存儲的用戶簡檔相比較來確定所述一個或多個信息項中每一個的分值;以及 依據它們相應的分值對所述服務中的所述一個或多個信息項進行重新排列。
10.如權利要求1-9中任一項所述的計算機實現的方法,其中所述信息項中的至少一個是網頁。
11.如權利要求1-10中任一項所述的計算機實現的方法,其中所述信息項中的至少一個是包括多個網頁的網站。
12.—種計算機系統,包括 一個或多個處理器; 存儲器;和 一個或多個程序,其中所述一個或多個程序存儲在所述存儲器中並且被配置為由所述一個或多個處理器執行,所述一個或多個程序包括 用於分別訪問用於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息的指令,其中所述第一信息項最初被分類而所述第二信息項最初未被分類; 用於訪問所述第一信息項的分類數據的指令; 用於基於所述第一信息項的所述分類數據以及所述歷史查詢信息為所述第二信息項生成分類數據的指令; 用於將所生成的分類數據存儲在所述伺服器系統中的指令;以及用於使用存儲在所述伺服器系統中的相對應分類數據向多個客戶端設備提供與所述第二信息項相關聯的定製服務的指令。
13.如權利要求12所述的計算機系統,其中用於為最初未分類的信息項生成分類數據的指令包括 用於識別所述歷史查詢信息中的查詢集合的指令,其中所述查詢的至少子集均具有與所述最初未分類的信息項相對應的相關聯搜索結果; 用於基於所述第一信息項的所述分類數據以及用於所述查詢集合的所述歷史查詢信息為所述查詢集合生成分類數據的指令;以及 用於通過將所述查詢子集的所生成的分類數據進行組合而為所述最初未分類的信息項生成分類數據的指令,所述查詢子集中的每一個具有與所述最初未分類的信息項相對應的相關聯搜索結果。
14.如權利要求13所述的計算機系統,進一步包括 用於更新所述歷史查詢信息的指令;和 用於重複進行下述步驟的指令在所述歷史查詢信息中識別查詢、對所述查詢生成分類數據、以及使用經更新的歷史查詢信息為所述最初未分類的信息項生成分類數據。
15.如權利要求13或14所述的計算機系統,其中用於為所述查詢集合生成分類數據的指令包括 用於識別與所述查詢的至少子集中的每一個相對應的搜索結果的集合以及與該搜索結果的集合相對應的所述第一信息項的集合的指令; 用於依據它們的相應預定義的信息檢索分值、它們的相對應搜索結果在該搜索結果的集合中的位置以及與相對應搜索結果的用戶交互信息對所識別的第一信息項的分類數據進行加權的指令;以及 用於將所識別的第一信息項的加權分類數據聚集為所述查詢的分類數據的指令。
16.如權利要求13或14所述的計算機系統,其中用於為所述最初未分類的信息項生成分類數據的指令包括 用於識別與所述查詢子集中的每一個相對應的搜索結果的集合的指令,其中所述搜索結果的集合包括與所述最初未分類的信息項相對應的至少一個搜索結果; 用於依據所述最初未分類的信息項的預定義的信息檢索分值、其相對應搜索結果在所述搜索結果的集合中的位置以及與所述相對應搜索結果的用戶交互信息對所述查詢的分類數據進行加權的指令;以及 用於將所述查詢子集的加權分類數據聚集為所述最初未分類的信息項的分類數據的指令。
17.如權利要求12-16中任一項所述的計算機系統,其中用於提供定製服務的指令包括 用於從相應的客戶端設備處的用戶接收查詢的指令,其中所述用戶具有相關聯的用戶簡檔; 用於識別與所述查詢相對應的搜索結果的集合的指令,其中所述搜索結果中的一個與所述第二信息項中的一個相關聯; 用於通過將所述第二信息項的所存儲的分類數據與所述用戶簡檔相比較來確定所述搜索結果的分值的指令; 用於依據所確定的分值將所述搜索結果關於其它搜索結果進行排序的指令;以及 用於向所述客戶端設備提供表示至少經排序的搜索結果的數據的指令。
18.如權利要求12-16中任一項所述的計算機系統,其中用於提供定製服務的指令包括 用於在所述歷史查詢信息中識別用戶所提交的查詢集合以及相對應的搜索結果的指令,其中所述搜索結果對應於所述第一和第二信息項中的一個或多個; 用於通過聚集所述一個或多個信息項的分類數據為所述用戶生成用戶簡檔的指令;用於將所生成的用戶簡檔存儲在所述伺服器系統中的指令;以及用於響應於來自客戶端設備處的用戶對服務的請求,使用所存儲的用戶簡檔定製所請求的服務的指令。
19.如權利要求18所述的計算機系統,其中用於定製所請求的服務的指令包括 用於響應於服務請求準備獨立於用戶的服務的指令,其中所述獨立於用戶的服務包括所述第一和第二信息項中的一個或多個; 用於通過將所述信息項的分類數據與所存儲的用戶簡檔相比較來確定所述一個或多個信息項中每一個的分值的指令;以及 用於依據它們相應的分值對所述服務中的所述一個或多個信息項進行重新排列的指令。
20.如權利要求12所述的計算機系統,其中所述一個或多個程序包括用於執行如權利要求1-10中任一項所述的方法的指令。
21.一種計算機可讀存儲介質以及實現於其中的一個或多個電腦程式,所述一個或多個電腦程式包括指令,當被計算機系統執行時,所述指令使得所述計算機系統 分別訪問用於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息,其中所述第一信息項最初被分類而所述第二信息項最初未被分類; 訪問所述第一信息項的分類數據; 基於所述第一信息項的所述分類數據以及所述歷史查詢信息為所述第二信息項生成分類數據; 將所生成的分類數據存儲在所述伺服器系統中;以及 使用存儲在所述伺服器系統中的相對應分類數據向多個客戶端設備提供與所述第二信息項相關聯的定製服務。
22.如權利要求21所述的計算機可讀存儲介質,其中用於為最初未分類的信息項生成分類數據的指令包括 用於識別所述歷史查詢信息中的查詢集合的指令,其中所述查詢的至少子集均具有與所述最初未分類的信息項相對應的相關聯搜索結果; 用於基於所述第一信息項的所述分類數據以及用於所述查詢集合的所述歷史查詢信息為所述查詢集合生成分類數據的指令;以及 用於通過將所述查詢子集的所生成的分類數據進行組合而為所述最初未分類的信息項生成分類數據的指令,所述查詢子集中的每一個具有與所述最初未分類的信息項相對應的相關聯搜索結果。
23.如權利要求22所述的計算機可讀存儲介質,進一步包括 用於更新所述歷史查詢信息的指令;和 用於重複下述步驟的指令在所述歷史查詢信息中識別查詢、對所述查詢生成分類數據、以及使用經更新的歷史查詢信息為所述最初未分類的信息項生成分類數據。
24.如權利要求22或23所述的計算機可讀存儲介質,其中用於為所述查詢集合生成分類數據的指令包括 用於識別與所述查詢的至少子集中的每一個相對應的搜索結果的集合以及與該搜索結果的集合相對應的所述第一信息項的集合的指令; 用於依據它們的相應預定義的信息檢索分值、它們的相對應搜索結果在該搜索結果的集合中的位置以及與相對應搜索結果的用戶交互信息對所識別的第一信息項的分類數據進行加權的指令;以及 用於將所識別的第一信息項的加權分類數據聚集為所述查詢的分類數據的指令。
25.如權利要求22或23所述的計算機可讀存儲介質,其中用於為最初未分類的信息項生成分類數據的指令包括 用於識別與所述查詢子集中的每一個相對應的搜索結果的集合的指令,其中所述搜索結果的集合包括與所述最初未分類的信息項相對應的至少一個搜索結果; 用於依據所述最初未分類的信息項的預定義的信息檢索分值、其相對應搜索結果在所述搜索結果的集合中的位置以及與所述相對應搜索結果的用戶交互信息對所述查詢的分類數據進行加權的指令;以及 用於將所述查詢子集的加權分類數據聚集為所述最初未分類的信息項的分類數據的指令。
26.如權利要求21所述的計算機可讀存儲介質,其中用於提供定製服務的指令包括 用於從相應的客戶端設備處的用戶接收查詢的指令,其中所述用戶具有相關聯的用戶簡檔; 用於識別與所述查詢相對應的搜索結果的集合的指令,其中所述搜索結果中的一個與所述第二信息項中的一個相關聯; 用於通過將所述第二信息項的所存儲的分類數據與所述用戶簡檔相比較來確定所述搜索結果的分值的指令; 用於依據所確定的分值將所述搜索結果關於其它搜索結果進行排序的指令;以及 用於向所述客戶端設備提供表示至少經排序的搜索結果的數據的指令。
27.如權利要求21-26中任一項所述的計算機可讀存儲介質,其中用於提供定製服務的指令包括 用於在所述歷史查詢信息中識別用戶所提交的查詢集合以及相對應的搜索結果的指令,其中所述搜索結果對應於所述第一和第二信息項中的一個或多個; 用於通過聚集所述一個或多個信息項的分類數據為所述用戶生成用戶簡檔的指令; 用於將所生成的用戶簡檔存儲在所述伺服器系統中的指令;以及 用於響應於來自客戶端設備處的用戶對服務的請求,使用所存儲的用戶簡檔定製所請求的服務的指令。
28.如權利要求27所述的計算機可讀存儲介質,其中用於定製所請求的服務的指令包括 用於響應於服務請求準備獨立於用戶的服務的指令,其中所述獨立於用戶的服務包括所述第一和第二信息項中的一個或多個; 用於通過將所述信息項的分類數據與所存儲的用戶簡檔相比較來確定所述一個或多個信息項中每一個的分值的指令;以及 用於依據它們相應的分值對所述服務中的所述一個或多個信息項進行重新排列的指 令。
29.如權利要求21所述的計算機可讀存儲介質,其中所述一個或多個電腦程式包括用於執行如權利要求1-10中任一項所述的方法的指令。
全文摘要
一種伺服器系統,其分別訪問用於具有對應於第一信息項和第二信息項的搜索結果的查詢的歷史查詢信息以及所述第一信息項的分類數據。最初,所述第一信息項被分類而所述第二信息項未被分類。基於所述第一信息項的分類數據以及所述歷史查詢信息,所述伺服器系統為所述第二信息項生成分類數據並且將所生成的分類數據存儲於其中。響應於來自客戶端設備的對服務的請求,所述伺服器系統使用所述第二信息項以及為所述第二信息項所生成的相對應分類數據向所述客戶端設備提供定製服務。
文檔編號G06F17/30GK102859516SQ201080024788
公開日2013年1月2日 申請日期2010年4月7日 優先權日2009年4月8日
發明者比爾蓋汗·烏伊加爾·厄茲泰金, 丘佩文 申請人:谷歌公司