新四季網

一種基於糾錯相關度對查詢序列進行糾錯的設備和方法

2023-07-26 21:34:31 1

專利名稱:一種基於糾錯相關度對查詢序列進行糾錯的設備和方法
技術領域:
本發明涉及網際網路搜索領域,尤其涉及網際網路搜索中對網絡用戶輸入進行糾錯的技術。
背景技術:
在現有技術中,當用戶輸入查詢序列進行搜索時,有時會出現因打字錯誤或輸入法選詞不當而生成錯誤字符串或詞組的情形,如果直接將這些錯誤字符串或詞組作為查詢關鍵詞來進行搜索,目前絕大多數搜尋引擎一般會主動給出經過簡單糾錯後的查詢序列, 其提示形式諸如,「你要搜索的是不是XXX」。此時,用戶只能被動地接受以「XXX」作為查詢關鍵詞而搜索出來的結果,在這一搜索過程中,用戶既無法知曉期望鍵入的查詢序列與經過簡單糾錯後的查詢序列之間相關度如何,也無法選擇除了上述簡單糾錯的查詢序列之外的其他可能適用的備選序列,由上述可知,當前搜尋引擎所提供的糾錯方式相對比較單一,而且很有可能會因糾錯準確率不高給用戶帶來負面的搜索體驗,降低用戶對於搜尋引擎的依賴性。有鑑於此,如何對查詢序列進行糾錯,提供相對應的糾錯序列,從而增強用戶與搜尋引擎之間的交互性,提升用戶的搜索體驗,是相關技術人員亟待解決的一項課題。

發明內容
本發明的目的是提供一種用於基於糾錯相關度對查詢序列進行糾錯的設備和方法。根據本發明的一個方面,提供一種用於對查詢序列進行糾錯的方法,其中,該方法包括以下步驟a獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;b根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;c根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果;d將所述查詢結果提供至所述用戶設備。根據本發明的另一個方面,還提供了一種用於對查詢序列進行糾錯的設備,其中, 所述設備包括第一獲取裝置,用於獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;選取裝置,用於根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;第二獲取裝置,用於根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果;提供裝置,用於將所述查詢結果提供至所述用戶設備。
根據本發明的再一個方面,還提供了一種搜尋引擎,其中,該搜尋引擎包括本發明的一個方面所述的用於對查詢序列進行糾錯的設備。與現有技術相比,本發明通過候選糾錯序列的糾錯相關度來合理地選擇對應的糾錯序列,並將所述糾錯序列對應的查詢結果提供給用戶,既提高了搜尋引擎對於用戶輸入的查詢序列的糾錯準確率,又增強了用戶與搜尋引擎之間的交互性,進而提升了用戶的搜索體驗。


通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發明的其它特徵、目的和優點將會變得更明顯圖1示出依據本發明一個方面的用於基於糾錯相關度對查詢序列進行糾錯的設備示意圖;圖2示出依據本發明一優選實施例的用於基於糾錯相關度對查詢序列進行糾錯的設備示意圖;圖3示出依據本發明另一方面的用於基於糾錯相關度對查詢序列進行糾錯的方法流程圖;圖4示出依據本發明一優選實施例的用於基於糾錯相關度對查詢序列進行糾錯的方法流程圖。附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施例方式下面結合附圖對本發明作進一步詳細描述。圖1示出依據本發明一個方面的用於基於糾錯相關度對查詢序列進行糾錯的設備示意圖。其中,所述糾錯設備1包括但不限於,單個網絡伺服器、多個網絡伺服器集、基於雲計算的計算機集合等,其中,雲計算是分布式計算的一種,它可以看作是由一群鬆散耦合的計算機集組成的一個超級虛擬計算機。參照圖1,所述糾錯設備1包括第一獲取裝置11、選取裝置12、第二獲取裝置13和提供裝置14。具體地,糾錯設備1的第一獲取裝置11獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;然後,選取裝置12根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;接著,第二獲取裝置13根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果;最後,提供裝置14將所述查詢結果提供給所述用戶設備。第一獲取裝置11用於獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列。具體地,第一獲取裝置11例如通過搜尋引擎等第三方設備所提供的應用程式接口 (API)或約定的通信方式,從該第三方設備獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;或者,通過搜尋引擎等第三方設備所提供的應用程式接口(API)或約定的通信方式,從該第三方設備獲取該用戶通過用戶設備輸入的查詢序列,並通過同音匹配、模糊音匹配或形近字匹配等方式,獲取與該查詢序列相對應的候選糾錯序列;或者,通過頁面技術,如ASP、JSP、PHP等,從用戶設備獲取用戶通過該用戶設備輸入的查詢序列,並通過同音匹配、模糊音匹配或形近字匹配等方式,獲取與該查詢序列相對應的候選糾錯序列。例如,當用戶通過用戶設備鍵入查詢序列「福容花」時,第一獲取裝置11從所述用戶設備獲取該查詢序列「福容花」,並通過同音匹配,基於與「福容」同音的「芙蓉」而得到候選糾錯序列「芙蓉花」;又如,當用戶通過用戶設備鍵入查詢序列「戍戌變法」時,第一獲取裝置 11從所述用戶設備獲取該查詢序列「戍戌變法」,並通過形近字匹配,基於與「戍戌」字形相近的「戊戌」而得到候選糾錯序列「戊戌變法」。又如,當用戶通過用戶設備輸入查詢序列包括英語單詞或單詞組合時,第一獲取裝置11通過諸如檢查所述英語單詞的拼寫錯誤並且查找與這些英語單詞拼寫序列相近的其他單詞,獲取與所述查詢序列相對應的候選糾錯序列。本領域技術人員應能理解上述獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列的方式僅為舉例,其他現有的或今後可能出現的獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。選取裝置12用於根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列。具體地,當第一獲取裝置11獲取所述候選糾錯序列後,選取裝置12根據所述候選糾錯序列的糾錯相關度,通過諸如排序、糾錯相關度閾值比較等方式,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列。例如,第一獲取裝置11獲取與所述查詢序列相對應的10個候選糾錯序列,其中,1個候選糾錯序列對應的糾錯相關度為0. 9,其餘9個候選糾錯序列對應的糾錯相關度均介於0. 4 0. 6之間,則選取裝置12根據這10個候選糾錯序列各自的糾錯相關度,選取糾錯相關度為0. 9的候選糾錯序列作為與所述查詢序列相對應的糾錯序列。在此,選取裝置12通過第三方設備所提供的應用程式接口(API)或約定的通信方式,從該第三方設備直接獲取候選糾錯序列相對該查詢序列的糾錯相關度,或者,根據所述候選糾錯序列的查詢次數、查詢頻率等信息,確定該候選糾錯序列相對該查詢序列的糾錯相關度。本領域技術人員應能理解上述選取與所述查詢序列相對應的糾錯序列的方式僅為舉例,其他現有的或今後可能出現的選取與所述查詢序列相對應的糾錯序列的方式如可適用於本發明,也應包含在本發明保護範圍以內, 並以引用方式包含於此。第二獲取裝置13用於根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果。具體地,在所述選取裝置12從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列後,第二獲取裝置13根據所選取的糾錯序列,通過諸如搜尋引擎伺服器的搜索索引庫來獲取與所述糾錯序列相對應的查詢結果。例如,在上例中,選取裝置12根據這10個候選糾錯序列各自的糾錯相關度,選取糾錯相關度為0.9的候選糾錯序列作為與所述查詢序列相對應的糾錯序列後,則第二獲取裝置13根據糾錯相關度為0. 9的糾錯序列,如「鮮花快遞」,在搜索索引庫中進行匹配查詢,以獲取對應的查詢結果,該查詢結果可以是與「鮮花快遞」相匹配的多個頁面搜索結果。又如,第一獲取裝置11獲取10個候選糾錯序列,這10個候選糾錯序列各自的糾錯相關度均介於0. 5 0. 7之間,此時選取裝置12將所有10個候選糾錯序列均作為糾錯序列,第二獲取裝置13分別根據這10個糾錯序列,在搜索索引庫中進行匹配查詢,以獲取所有10個糾錯序列中每一個糾錯序列對應的查詢結果。本領域技術人員應能理解上述獲取與所述糾錯序列相對應的查詢結果的方式僅為舉例,其他現有的或今後可能出現的獲取與所述糾錯序列相對應的查詢結果的方式如可適用於本發明,也應包
7含在本發明保護範圍以內,並以引用方式包含於此。提供裝置14用於將所述查詢結果提供至所述用戶設備。具體地,通過第二獲取裝置13獲取與所述糾錯序列相對應的查詢結果後,提供裝置14通過諸如直接展現查詢結果、提供與所述查詢結果相對應的超連結等方式,將所述查詢結果提供至所述用戶設備。在此,所述查詢結果包括但不限於一個網頁、一個圖片、一個電子郵件地址、一個文件,甚至是一個應用程式。而所述超連結包括但不限於文字超連結、圖片超連結或logo超連結等。例如,當所述提供裝置14將與所述查詢結果相對應的超連結提供至所述用戶設備時,用戶點擊所述超連結後,查詢結果將顯示在瀏覽器上,諸如,網頁、圖片、電子郵件地址、文件、應用程式。本領域技術人員應能理解上述將所述查詢結果提供至所述用戶設備的方式僅為舉例,其他現有的或今後可能出現的將所述查詢結果提供至所述用戶設備的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,所述第一獲取裝置11還根據所述查詢序列,結合預設糾錯規則,獲取所述候選糾錯序列。更優選地,所述預設糾錯規則基於以下至少任一項-所述查詢序列的同音匹配;-所述查詢序列的模糊音匹配;-所述查詢序列的形近字匹配;-與所述查詢序列相對應的編輯距離閾值。以所述查詢序列的同音匹配為例,當用戶通過用戶設備鍵入所述查詢序列時,第一獲取裝置11根據鍵入的查詢序列獲取與所述查詢序列相對應的拼音字符串,通過諸如切詞處理將所述拼音字符串劃分為若干個子字符串,對其中的子字符串進行同音匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「鴨梨試驗」時,第一獲取裝置11基於查詢序列的同音匹配,獲取候選糾錯序列「壓力試驗」、「壓力實驗」、「壓力時延」 等。以所述查詢序列的模糊音匹配為例,當用戶通過用戶設備鍵入所述查詢序列時,第一獲取裝置11根據鍵入的查詢序列獲取與所述查詢序列相對應的拼音字符串,通過諸如切詞處理將所述拼音字符串劃分為若干個子字符串,對其中的子字符串進行模糊音匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「栓甜苦辣」時,第一獲取裝置11基於查詢序列的模糊音匹配,獲取候選糾錯序列「酸甜苦辣」。以所述查詢序列的形近字匹配為例,當用戶通過用戶設備鍵入所述查詢序列時,第一獲取裝置11根據鍵入的查詢序列,通過諸如切詞處理將所述查詢序列劃分為若干個子字符串,對其中的子字符串進行形近字匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「遊戈空間」 時,第一獲取裝置11基於查詢序列的形近字匹配,可獲取候選糾錯序列「遊弋空間」。以所述查詢序列對應的編輯距離閾值為例,假定該編輯距離閾值為3,例如,當用戶鍵入查詢序列「福容花」時,將其中的「福」改寫為「芙」,「容」改寫為「蓉」,可以得到另一查詢序列「芙蓉花」,由於這兩個查詢序列之間的編輯距離為2,小於上述編輯距離閾值3,則可以將「芙蓉花」作為所述查詢序列「福容花」的候選糾錯序列。又如,當用戶鍵入查詢序列「hllo」時, 一種可能的方式是在h與1之間插入e,得到「hello」,另一種可能的方式是在h與1之間插入0,在ο後面添加w,得到「hollow」,由於查詢序列「hllo」與查詢序列「hello」之間的編輯距離以及查詢序列「hllo」與查詢序列「hollow」之間的編輯距離均為2,小於上述編輯距離閾值3,則可以將「hello」和「hollow」同時作為所述查詢序列「hllo」的候選糾錯序列。在一個優選實施例中(參照圖1),所述糾錯設備1還包括第三獲取裝置(未示出),該第三獲取裝置基於預設的相關度規則,根據所述候選糾錯序列,獲取所述候選糾錯序列的糾錯相關度。以下參照圖1對該優選實施例進行詳細描述,其中,第一獲取裝置11 獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列,其具體過程與前述參照圖1所描述的實施例中第一獲取裝置11所執行的過程相同,為簡明起見,以引用方式包含於此,而不做贅述。優選地,所述預設的相關度規則包括基於以下至少任一項來獲取所述候選糾錯序列的糾錯相關度-所述查詢序列與所述候選糾錯序列的共現頻率;-所述查詢序列與所述候選糾錯序列之間的共現詞數量;-所述候選糾錯序列的查詢次數;-所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度。以所述查詢序列與所述候選糾錯序列的共現頻率為例,當用戶輸入的查詢序列與所獲取的候選糾錯序列的共現頻率越高,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。在此,查詢序列與候選糾錯序列共現頻率是指查詢序列與候選糾錯序列同時出現的頻率高低。例如,輸入查詢序列「蒼蠅」,欲搜索其在疾病症狀方面的信息,則候選糾錯序列可從其共現詞典中選擇「傳播疾病」「腸胃病」「傷寒」「霍亂」「嘔吐」 「除四害」等。以所述查詢序列與所述候選糾錯序列之間的共現詞數量為例,當用戶輸入的查詢序列與所述候選糾錯序列之間的共現詞個數越多時,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。以所述候選糾錯序列的查詢次數為例,當所述候選糾錯序列的查詢次數越大時,所述候選糾錯序列的糾錯相關度越高,反之, 所述候選糾錯序列的糾錯相關度越低。最後,以所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度為例,當所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果之間的匹配度較高時,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。此外,本發明還可以基於上述預設的相關度規則中各條規則之間的任意組合,來得到所述候選糾錯序列的糾錯相關度。在此,第三獲取裝置通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的通信方式,從該第三方設備獲取上述預設的相關度規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設的相關度規則。本領域技術人員應能理解上述預設的相關度規則僅為舉例,其他現有的或今後可能出現的預設的相關度規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。本領域技術人員應能理解,上述第一獲取裝置11與第三獲取裝置僅為示例,在本發明的其他優選實施例中,它們可以是兩個獨立的模塊,也可全部集成在一個模塊中。在一個優選實施例中(參照圖1),所述選取裝置12還根據所述候選糾錯序列的糾錯相關度,對所述候選糾錯序列進行排序,以獲取所述經排序的候選糾錯序列;從所述經排序的候選糾錯序列中選取所述糾錯序列。例如,每個候選糾錯序列均對應於各自的糾錯相關度,選取裝置12根據所述糾錯相關度的數值大小對所述候選糾錯序列進行排序,然後從經過排序的候選糾錯序列中選取糾錯序列。諸如,5個候選糾錯序列各自的糾錯相關度分別為0. 4,0. 8,0. 5,0. 9和0. 6,選取裝置12根據這5個候選糾錯序列的糾錯相關度的數值大
9小,對所述候選糾錯序列進行排序,依次為糾錯相關度分別為0. 4、0. 5、0. 6、0. 8和0. 9所對應的候選糾錯序列;或者,依次為糾錯相關度分別為0. 9,0. 8,0. 6、0. 5和0. 4所對應的候選糾錯序列。由於候選糾錯序列已根據糾錯相關度的數值大小進行排序,從而更加容易從中選取糾錯序列。在另一個優選實施例中(參照圖1),所述選取裝置12還根據所述候選糾錯序列的糾錯相關度,結合預設的糾錯相關度閾值,確定與所述候選糾錯序列相對應的糾錯等級; 根據所述糾錯等級,從所述候選糾錯序列中選取所述糾錯序列。例如,假設所述預設的糾錯相關度閾值為0. 5,所述選取裝置12將所述候選糾錯序列基於糾錯相關度劃分為高級和低級,然後將糾錯等級為高級的候選糾錯序列作為糾錯序列。又如,假設所述預設的糾錯相關度閾值為0. 2和0. 8,所述選取裝置12將所述候選糾錯序列基於糾錯相關度劃分為高級、中級和低級,然後將糾錯等級為高級和中級的候選糾錯序列作為糾錯序列。由於候選糾錯序列已根據預設的糾錯相關度閾值確定與所述候選糾錯序列相對應的糾錯等級,也更加方便地根據糾錯等級來選取糾錯序列。在另一個優選實施例中(參照圖1),所述提供裝置14還基於預設提供規則,將與所述糾錯序列相對應的查詢結果提供至所述用戶設備;其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶設備-所述查詢結果的提供區域;-所述查詢結果的邊界標註;-所述查詢結果的顯示顏色;-所述查詢結果的提供順序。以所述查詢結果的提供區域為例,當用戶輸入查詢序列後,所述糾錯設備1的第一獲取裝置11首先獲取與所述查詢序列相對應的候選糾錯序列,然後,選擇裝置12根據該候選糾錯序列的糾錯相關度來選取糾錯序列,接著,第二獲取裝置13根據所選取的糾錯序列,獲取與所述糾錯序列相對應的查詢結果,最後,提供裝置14根據所述查詢結果的提供區域將與所述糾錯序列相對應的查詢結果提供至所述用戶設備。以所述查詢結果的邊界標註為例,所述提供裝置14根據所述查詢結果的邊界標註將與所述糾錯序列相對應的查詢結果提供至所述用戶設備。例如,所述提供裝置14將查詢結果提供給用戶設備時,在不同的查詢結果之間進行邊界標註,以明確表明邊界相對兩側的查詢結果來自於不同的糾錯序列和/或查詢序列。以所述查詢結果的顯示顏色為例,所述提供裝置14根據所述查詢結果的顯示顏色將與所述糾錯序列相對應的查詢結果提供至所述用戶設備。以所述查詢結果的提供順序為例,所述提供裝置14在提供與多個糾錯序列相對應的查詢結果時,基於糾錯序列的糾錯相關度高低來順序地提供所述查詢結果;或者,在提供至少一個糾錯序列相對應的查詢結果以及用戶輸入的查詢序列相對應的查詢結果時,先提供用戶所輸入的查詢序列的查詢結果隨後提供糾錯序列相對應的查詢結果,或者,在提供用戶輸入的查詢序列相對應的查詢結果以及至少一個糾錯序列相對應的查詢結果時,先提供糾錯序列相對應的查詢結果隨後提供用戶所輸入的查詢序列的查詢結果。在此,提供裝置14通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的提供方式,從該第三方設備獲取上述預設提供規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設提供規則。本領域技術人員應能理解上述預設提供規則僅為舉例,其他現有的或今後可能出現的預設提供規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,所述提供裝置14還提供與所述糾錯序列相對應的所述糾錯相關度以及所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,所述提供裝置14在提供所述糾錯序列相對應的查詢結果時,通過頁面技術,如JSP、ASP或PHP等,將與所述糾錯序列相對應的糾錯相關度與所述查詢結果一併提供給用戶設備。採用該提供方式,本發明在將糾錯相關度和查詢結果提供給用戶設備時,用戶還可以藉助於糾錯相關度來確定搜尋引擎對於當前輸入的查詢序列的糾錯準確率,進一步增強了用戶與搜尋引擎之間的交互體驗。圖2示出依據本發明一優選實施例的用於基於糾錯相關度對查詢序列進行糾錯的設備的結構示意圖。其中,所述糾錯設備1』包括但不限於,單個網絡伺服器、多個網絡伺服器集、基於雲計算的計算機集合等,其中,雲計算是分布式計算的一種,它可以看作是由一群鬆散耦合的計算機集組成的一個超級虛擬計算機。參照圖2,所述糾錯設備1』包括第一獲取裝置11』、選取裝置12』、第二獲取裝置 13』、提供裝置14』和第四獲取裝置15』。具體地,糾錯設備1』的第一獲取裝置11』獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;接著,選取裝置12』根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列,並行可操作地,第四獲取裝置15』根據所述查詢序列,獲取與所述查詢序列相對應的查詢結果;然後,第二獲取裝置13』根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果;最後,提供裝置14』將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供給所述用戶設備。為描述簡便起見,在圖2所示的糾錯設備1』中,第一獲取裝置11』、選取裝置12』、 第二獲取裝置13』分別與圖1所示的第一獲取裝置11、選取裝置12、第二獲取裝置13相同, 故此處不再贅述,並通過引用的方式包含於此。第四獲取裝置15』用於根據所述查詢序列,獲取與所述查詢序列相對應的查詢結果。具體地,第四獲取裝置15』通過諸如查詢序列的切詞處理、減小所述查詢序列的檢索粒度等方式,並以切詞後的若干詞條或更小的檢索粒度作為新查詢序列來獲取與所述查詢序列相對應的查詢結果。例如,當用戶輸入「福容花」時,第四獲取裝置15』通過將所述查詢序列切詞為「/福容/花/」,然後以「福容」作為新的查詢序列來獲取與所述查詢序列相對應的查詢結果,諸如可能出現的查詢結果為「福容大飯店」,「福容小學」等等。本領域技術人員應能理解上述獲取與所述查詢序列相對應的查詢結果的方式僅為舉例,其他現有的或今後可能出現的獲取與所述查詢序列相對應的查詢結果的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。然後,提供裝置14』提供與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,第二獲取裝置13』獲取與所述糾錯序列相對應的查詢結果,以及第四獲取裝置15』獲取與所述查詢序列相對應的查詢結果後,提供裝置14』通過諸如直接展現所述查詢序列和所述糾錯序列各自的查詢結果、提供與所述查詢序列和所述糾錯序列各自的查詢結果相對應的超連結等方式將所述查詢序列和所述糾錯序列各自所對應的查詢結果提供至所述用戶設備。在此,所述查詢結果包括但不限於一個網頁、一個圖片、一個電子郵件地址、一個文件,甚至是一個應用程式。而所述超連結包括但不限於文字超連結、圖片超連結或logo超連結等。例如,當所述提供裝置14』將與所述糾錯序列和/或所述查詢序列各自的查詢結果相對應的超連結提供至所述用戶設備時,用戶點擊所述超連結後,查詢結果將顯示在瀏覽器上,諸如,網頁、圖片、電子郵件地址、文件、應用程式。當利用所述提供裝置14』提供所述查詢序列對應的查詢結果以及所述糾錯序列對應的查詢結果時,所述用戶不僅能夠得到用戶查詢序列本身所對應的查詢結果,還能夠得到經糾錯處理後的糾錯序列所對應的查詢結果,因而用戶可以根據自身需求來選擇查看所述查詢序列或所述糾錯序列對應的查詢結果。例如,當所述第一獲取裝置11』所獲取的候選糾錯序列的糾錯相關度均不高,所述選取裝置12』將所有的候選糾錯序列作為糾錯序列時,所述第二獲取裝置13』通過搜索索引庫中的匹配查詢而得到所有糾錯序列對應的查詢結果,在此情形下,所述提供裝置14』提供所述查詢序列對應的查詢結果,因而用戶可將該查詢序列的查詢結果與所有糾錯序列的查詢結果進行比較,以選擇查看基於糾錯前的查詢序列或糾錯後的糾錯序列得到的查詢結果,提升了用戶的搜索體驗。本領域技術人員應能理解上述將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備的方式僅為舉例,其他現有的或今後可能出現的將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。本領域技術人員應能理解,上述第二獲取裝置13』與第四獲取裝置15』僅為示例, 在本發明的其他優選實施例中,它們可以是兩個獨立的模塊,也可全部集成在一個模塊中。在另一個優選實施例中(參照圖2),所述提供裝置14』還基於預設提供規則,將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備;其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶設備-所述查詢結果的提供區域;-所述查詢結果的邊界標註;-所述查詢結果的顯示顏色;-所述查詢結果的提供順序。以所述查詢結果的提供區域為例,提供裝置14』根據所述查詢結果的提供區域將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備,例如,將所述糾錯序列相對應的查詢結果提供在用戶設備的瀏覽器的左側,而將所述查詢序列相對應的查詢結果提供在用戶設備的瀏覽器的右側。以所述查詢結果的邊界標註為例,所述提供裝置14』根據所述查詢結果的邊界標註將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備。例如,所述提供裝置14』 將這些查詢結果提供給用戶設備時,在不同的查詢結果之間進行邊界標註,以明確表明邊界相對兩側的查詢結果來自於糾錯序列或查詢序列。以所述查詢結果的顯示顏色為例,所述提供裝置14』根據所述查詢結果的顯示顏色將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備。以所述查詢結果的提供順序為例, 所述提供裝置14在提供所述糾錯序列相對應的查詢結果以及所述查詢序列相對應的查詢結果時,先提供所述查詢序列的查詢結果隨後提供所述糾錯序列相對應的查詢結果,或者, 先提供糾錯序列相對應的查詢結果隨後提供所述查詢序列的查詢結果。在此,提供裝置14』 通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的提供方式,從該第三方設備獲取上述預設提供規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設提供規則。本領域技術人員應能理解上述預設提供規則僅為舉例,其他現有的或今後可能出現的預設提供規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,所述提供裝置14』還提供與所述糾錯序列相對應的所述糾錯相關度以及所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,所述提供裝置14』在提供所述糾錯序列相對應的查詢結果時,通過頁面技術,如JSP、ASP或PHP等,將與所述糾錯序列相對應的糾錯相關度與所述查詢結果一併提供給用戶設備。採用該提供方式,本發明在將糾錯相關度和查詢結果提供給用戶設備時,用戶還可以藉助於糾錯相關度來確定搜尋引擎對於當前輸入的查詢序列的糾錯準確率,進一步增強了用戶與搜尋引擎之間的交互體驗。此外,上述用於基於糾錯相關度對查詢序列進行糾錯的糾錯設備可以與現有的搜尋引擎相結合,構成一種新的搜尋引擎,現有的搜尋引擎可以採用已知的如百度、Google、 Yahoo等搜尋引擎。圖3示出依據本發明另一方面的用於基於糾錯相關度對查詢序列進行糾錯的方法流程圖。其中,用於基於糾錯相關度對查詢序列進行糾錯的糾錯設備包括但不限於,單個網絡伺服器、多個網絡伺服器集、基於雲計算的計算機集合等,其中,雲計算是分布式計算的一種,它可以看作是由一群鬆散耦合的計算機集組成的一個超級虛擬計算機。參照圖3,在步驟Sl中,所述糾錯設備獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列。具體地,所述糾錯設備例如通過搜尋引擎等第三方設備所提供的應用程式接口(API)或約定的通信方式,從該第三方設備獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;或者,通過搜尋引擎等第三方設備所提供的應用程式接口(API)或約定的通信方式,從該第三方設備獲取該用戶通過用戶設備輸入的查詢序列, 並通過同音匹配、模糊音匹配或形近字匹配等方式,獲取與該查詢序列相對應的候選糾錯序列;或者,通過頁面技術,如ASP、JSP、PHP等,從用戶設備獲取用戶通過該用戶設備輸入的查詢序列,並通過同音匹配、模糊音匹配或形近字匹配等方式,獲取與該查詢序列相對應的候選糾錯序列。例如,當用戶通過用戶設備鍵入查詢序列「福容花」時,所述糾錯設備從所述用戶設備獲取該查詢序列「福容花」,並通過同音匹配,基於與「福容」同音的「芙蓉」而得到候選糾錯序列「芙蓉花」;又如,當用戶通過用戶設備鍵入查詢序列「戍戌變法」時,所述糾錯設備從所述用戶設備獲取該查詢序列「戍戌變法」,並通過形近字匹配,基於與「戍戌」 字形相近的「戊戌」而得到候選糾錯序列「戊戌變法」。又如,當用戶通過用戶設備輸入查詢序列包括英語單詞或單詞組合時,所述糾錯設備通過諸如檢查所述英語單詞的拼寫錯誤並且查找與這些英語單詞拼寫序列相近的其他單詞,獲取與所述查詢序列相對應的候選糾錯序列。本領域技術人員應能理解上述獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列的方式僅為舉例,其他現有的或今後可能出現的獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。在步驟S2中,所述糾錯設備根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列。具體地,當通過所述步驟Sl獲取所述候選糾錯序列後,所述糾錯設備在步驟S2中根據所述候選糾錯序列的糾錯相關度,通過諸如排序、糾錯相關度閾值比較等方式,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列。例如,所述糾錯設備獲取與所述查詢序列相對應的10個候選糾錯序列,其中,1 個候選糾錯序列對應的糾錯相關度為0. 9,其餘9個候選糾錯序列對應的糾錯相關度均介於0. 4 0. 6之間,然後根據這10個候選糾錯序列各自的糾錯相關度,選取糾錯相關度為 0.9的候選糾錯序列作為與所述查詢序列相對應的糾錯序列。在此,所述糾錯設備通過第三方設備所提供的應用程式接口(API)或約定的通信方式,從該第三方設備直接獲取候選糾錯序列相對該查詢序列的糾錯相關度,或者,根據所述候選糾錯序列的查詢次數、查詢頻率等信息,確定該候選糾錯序列相對該查詢序列的糾錯相關度。本領域技術人員應能理解上述選取與所述查詢序列相對應的糾錯序列的方式僅為舉例,其他現有的或今後可能出現的選取與所述查詢序列相對應的糾錯序列的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。在步驟S3中,所述糾錯設備根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果。具體地,在所述步驟S2從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列後,所述糾錯設備根據所選取的糾錯序列,通過諸如搜尋引擎伺服器的搜索索引庫來獲取與所述糾錯序列相對應的查詢結果。例如,在上例中,所述糾錯設備根據這10個候選糾錯序列各自的糾錯相關度,選取糾錯相關度為0.9的候選糾錯序列作為與所述查詢序列相對應的糾錯序列後,然後根據糾錯相關度為0. 9的糾錯序列,如「鮮花快遞」,在搜索索引庫中進行匹配查詢,以獲取對應的查詢結果,該查詢結果可以是與「鮮花快遞」相匹配的多個頁面搜索結果。又如,所述糾錯設備獲取10個候選糾錯序列,這10個候選糾錯序列各自的糾錯相關度均介於0. 5 0. 7之間,此時將所有10個候選糾錯序列均作為糾錯序列,然後分別根據這10個糾錯序列,在搜索索引庫中進行匹配查詢,以獲取所有10個糾錯序列中每一個糾錯序列對應的查詢結果。本領域技術人員應能理解上述獲取與所述糾錯序列相對應的查詢結果的方式僅為舉例,其他現有的或今後可能出現的獲取與所述糾錯序列相對應的查詢結果的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。在步驟S4中,所述糾錯設備將所述查詢結果提供至所述用戶設備。具體地,通過所述步驟S3獲取與所述糾錯序列相對應的查詢結果後,所述糾錯設備通過諸如直接展現查詢結果、提供與所述查詢結果相對應的超連結等方式,將所述查詢結果提供至所述用戶設備。在此,所述查詢結果包括但不限於一個網頁、一個圖片、一個電子郵件地址、一個文件,甚至是一個應用程式。而所述超連結包括但不限於文字超連結、圖片超連結或logo超連結等。例如,當所述糾錯設備將與所述查詢結果相對應的超連結提供至所述用戶設備時, 用戶點擊所述超連結後,查詢結果將顯示在瀏覽器上,諸如,網頁、圖片、電子郵件地址、文件、應用程式。本領域技術人員應能理解上述將所述查詢結果提供至所述用戶設備的方式僅為舉例,其他現有的或今後可能出現的將所述查詢結果提供至所述用戶設備的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,在所述步驟Sl中,所述糾錯設備還根據所述查詢序列,結合預設糾錯規則,獲取所述候選糾錯序列。更優選地,所述預設糾錯規則基於以下至少任一項-所述查詢序列的同音匹配;-所述查詢序列的模糊音匹配;
-所述查詢序列的形近字匹配;-與所述查詢序列相對應的編輯距離閾值。以所述查詢序列的同音匹配為例,當用戶通過用戶設備鍵入所述查詢序列時,所述糾錯設備根據鍵入的查詢序列獲取與所述查詢序列相對應的拼音字符串,通過諸如切詞處理將所述拼音字符串劃分為若干個子字符串,對其中的子字符串進行同音匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「鴨梨試驗」時,所述糾錯設備基於查詢序列的同音匹配,獲取候選糾錯序列「壓力試驗」、「壓力實驗」、「壓力時延」等。以所述查詢序列的模糊音匹配為例,當用戶通過用戶設備鍵入所述查詢序列時,所述糾錯設備根據鍵入的查詢序列獲取與所述查詢序列相對應的拼音字符串,通過諸如切詞處理將所述拼音字符串劃分為若干個子字符串,對其中的子字符串進行模糊音匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「栓甜苦辣」時,所述糾錯設備基於查詢序列的模糊音匹配,獲取候選糾錯序列「酸甜苦辣」。以所述查詢序列的形近字匹配為例, 當用戶通過用戶設備鍵入所述查詢序列時,所述糾錯設備根據鍵入的查詢序列,通過諸如切詞處理將所述查詢序列劃分為若干個子字符串,對其中的子字符串進行形近字匹配,來獲取與所述查詢序列相對應的候選糾錯序列。例如,當用戶鍵入「遊戈空間」時,所述糾錯設備基於查詢序列的形近字匹配,可獲取候選糾錯序列「遊弋空間」。以所述查詢序列對應的編輯距離閾值為例,假定該編輯距離閾值為3,例如,當用戶鍵入查詢序列「福容花」時,將其中的「福」改寫為「芙」,「容」改寫為「蓉」,可以得到另一查詢序列「芙蓉花」,由於這兩個查詢序列之間的編輯距離為2,小於上述編輯距離閾值3,則可以將「芙蓉花」作為所述查詢序列「福容花」的候選糾錯序列。又如,當用戶鍵入查詢序列「hllo」時,一種可能的方式是在h與1之間插入e,得到「hello」,另一種可能的方式是在h與1之間插入0,在ο後面添加w,得到「hollow」,由於查詢序列「hllo」與查詢序列「hello」之間的編輯距離以及查詢序列「hllo」與查詢序列「hollow」之間的編輯距離均為2,小於上述編輯距離閾值3,則可以將「hello」和「hoilow」同時作為所述查詢序列「hiΙο」的候選糾錯序列。在一個優選實施例中(參照圖幻,該方法還包括步驟S6 (未示出),在所述步驟S6 中,所述糾錯設備基於預設的相關度規則,根據所述候選糾錯序列,獲取所述候選糾錯序列的糾錯相關度。優選地,所述預設的相關度規則包括基於以下至少任一項來獲取所述候選糾錯序列的糾錯相關度-所述查詢序列與所述候選糾錯序列的共現頻率;-所述查詢序列與所述候選糾錯序列之間的共現詞數量;-所述候選糾錯序列的查詢次數;-所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度。以所述查詢序列與所述候選糾錯序列的共現頻率為例,當用戶輸入的查詢序列與所獲取的候選糾錯序列的共現頻率越高,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。以所述查詢序列與所述候選糾錯序列之間的共現詞數量為例,當用戶輸入的查詢序列與所述候選糾錯序列之間的共現詞個數越多時,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。以所述候選糾錯序列的查詢次數為例,當所述候選糾錯序列的查詢次數越大時,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。最後,以所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度為例,當所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果之間的匹配度較高時,所述候選糾錯序列的糾錯相關度越高,反之,所述候選糾錯序列的糾錯相關度越低。此外,本發明還可以基於上述預設的相關度規則中各條規則之間的任意組合,來得到所述候選糾錯序列的糾錯相關度。在此,所述糾錯設備通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的通信方式,從該第三方設備獲取上述預設的相關度規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設的相關度規則。本領域技術人員應能理解上述預設的相關度規則僅為舉例,其他現有的或今後可能出現的預設的相關度規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。在一個優選實施例中(參照圖幻,所述步驟S2中,所述糾錯設備還根據所述候選糾錯序列的糾錯相關度,對所述候選糾錯序列進行排序,以獲取所述經排序的候選糾錯序列;從所述經排序的候選糾錯序列中選取所述糾錯序列。例如,每個候選糾錯序列均對應於各自的糾錯相關度,所述糾錯設備根據所述糾錯相關度的數值大小對所述候選糾錯序列進行排序,然後從經過排序的候選糾錯序列中選取糾錯序列。諸如,5個候選糾錯序列各自的糾錯相關度分別為0. 4,0. 8,0. 5,0. 9和0. 6,所述糾錯設備根據這5個候選糾錯序列的糾錯相關度的數值大小,對所述候選糾錯序列進行排序,依次為糾錯相關度分別為0. 4,0. 5、 0. 6,0. 8和0. 9所對應的候選糾錯序列;或者,依次為糾錯相關度分別為0. 9,0. 8,0. 6,0. 5 和0.4所對應的候選糾錯序列。由於候選糾錯序列已根據糾錯相關度的數值大小進行排序,從而更加容易從中選取糾錯序列。在另一個優選實施例中(參照圖幻,所述步驟S2中,所述糾錯設備還根據所述候選糾錯序列的糾錯相關度,結合預設的糾錯相關度閾值,確定與所述候選糾錯序列相對應的糾錯等級;根據所述糾錯等級,從所述候選糾錯序列中選取所述糾錯序列。例如,假設所述預設的糾錯相關度閾值為0. 5,所述糾錯設備將所述候選糾錯序列基於糾錯相關度劃分為高級和低級,然後將糾錯等級為高級的候選糾錯序列作為糾錯序列。又如,假設所述預設的糾錯相關度閾值為0. 2和0. 8,所述糾錯設備將所述候選糾錯序列基於糾錯相關度劃分為高級、中級和低級,然後將糾錯等級為高級和中級的候選糾錯序列作為糾錯序列。由於候選糾錯序列已根據預設的糾錯相關度閾值確定與所述候選糾錯序列相對應的糾錯等級,也更加方便地根據糾錯等級來選取糾錯序列。在另一個優選實施例中(參照圖3),所述步驟S4中,所述糾錯設備還基於預設提供規則,將與所述糾錯序列相對應的查詢結果提供至所述用戶設備;其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶設備-所述查詢結果的提供區域;-所述查詢結果的邊界標註;-所述查詢結果的顯示顏色;-所述查詢結果的提供順序。以所述查詢結果的提供區域為例,當用戶輸入查詢序列後,所述糾錯設備首先獲取與所述查詢序列相對應的候選糾錯序列;然後,根據該候選糾錯序列的糾錯相關度來選取糾錯序列;接著,根據所選取的糾錯序列,獲取與所述糾錯序列相對應的查詢結果;最後,根據所述查詢結果的提供區域將與所述糾錯序列相對應的查詢結果提供至所述用戶設
16備。以所述查詢結果的邊界標註為例,所述糾錯設備根據所述查詢結果的邊界標註將與所述糾錯序列相對應的查詢結果提供至所述用戶設備。例如,所述糾錯設備將查詢結果提供給用戶設備時,在不同的查詢結果之間進行邊界標註,以明確表明邊界相對兩側的查詢結果來自於不同的糾錯序列和/或查詢序列。以所述查詢結果的顯示顏色為例,所述糾錯設備根據所述查詢結果的顯示顏色將與所述糾錯序列相對應的查詢結果提供至所述用戶設備。以所述查詢結果的提供順序為例,所述糾錯設備在提供與多個糾錯序列相對應的查詢結果時,基於糾錯序列的糾錯相關度高低來順序地提供所述查詢結果;或者,在提供至少一個糾錯序列相對應的查詢結果以及用戶輸入的查詢序列相對應的查詢結果時,先提供用戶所輸入的查詢序列的查詢結果隨後提供糾錯序列相對應的查詢結果,或者,在提供用戶輸入的查詢序列相對應的查詢結果以及至少一個糾錯序列相對應的查詢結果時,先提供糾錯序列相對應的查詢結果隨後提供用戶所輸入的查詢序列的查詢結果。在此,所述糾錯設備通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的提供方式,從該第三方設備獲取上述預設提供規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設提供規則。本領域技術人員應能理解上述預設提供規則僅為舉例,其他現有的或今後可能出現的預設提供規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,在所述步驟S4中,所述糾錯設備還提供與所述糾錯序列相對應的所述糾錯相關度以及所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,所述糾錯設備在提供所述糾錯序列相對應的查詢結果時,通過頁面技術,如JSP、ASP或PHP等,將與所述糾錯序列相對應的糾錯相關度與所述查詢結果一併提供給用戶設備。採用該提供方式,本發明在將糾錯相關度和查詢結果提供給用戶設備時,用戶還可以藉助於糾錯相關度來確定搜尋引擎對於當前輸入的查詢序列的糾錯準確率,進一步增強了用戶與搜尋引擎之間的交互體驗。圖4示出依據本發明一優選實施例的用於基於糾錯相關度對查詢序列進行糾錯的方法流程圖。其中,用於基於糾錯相關度對查詢序列進行糾錯的糾錯設備包括但不限於, 單個網絡伺服器、多個網絡伺服器集、基於雲計算的計算機集合等,其中,雲計算是分布式計算的一種,它可以看作是由一群鬆散耦合的計算機集組成的一個超級虛擬計算機。為描述簡便起見,在圖4所示的糾錯方法中,步驟Si』、步驟S2』、步驟S3』分別與圖3所示的步驟Si、步驟S2、步驟S3相同或相似,故此處不再贅述,並通過引用的方式包含於此。在步驟S5』中,所述糾錯設備根據所述查詢序列,獲取與所述查詢序列相對應的查詢結果。具體地,所述糾錯設備通過諸如查詢序列的切詞處理、減小所述查詢序列的檢索粒度等方式,並以切詞後的若干詞條或更小的檢索粒度作為新查詢序列來獲取與所述查詢序列相對應的查詢結果。例如,當用戶輸入「福容花」時,所述糾錯設備通過將所述查詢序列切詞為「/福容/花/」,然後以「福容」作為新的查詢序列來獲取與所述查詢序列相對應的查詢結果,諸如可能出現的查詢結果為「福容大飯店」,「福容小學」等等。本領域技術人員應能理解上述獲取與所述查詢序列相對應的查詢結果的方式僅為舉例,其他現有的或今後可能出現的獲取與所述查詢序列相對應的查詢結果的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。
17
然後,在所述步驟S4』中,所述糾錯設備提供與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,通過所述步驟S3』獲取與所述糾錯序列相對應的查詢結果,以及通過所述步驟S5』獲取與所述查詢序列相對應的查詢結果後,所述糾錯設備通過諸如直接展現所述查詢序列和所述糾錯序列各自的查詢結果、 提供與所述查詢序列和所述糾錯序列各自的查詢結果相對應的超連結等方式將所述查詢序列和所述糾錯序列各自所對應的查詢結果提供至所述用戶設備。在此,所述查詢結果包括但不限於一個網頁、一個圖片、一個電子郵件地址、一個文件,甚至是一個應用程式。而所述超連結包括但不限於文字超連結、圖片超連結或logo超連結等。例如,當所述糾錯設備將與所述糾錯序列和/或所述查詢序列各自的查詢結果相對應的超連結提供至所述用戶設備時,用戶點擊所述超連結後,查詢結果將顯示在瀏覽器上,諸如,網頁、圖片、電子郵件地址、文件、應用程式。當利用所述步驟S4』提供所述查詢序列對應的查詢結果以及所述糾錯序列對應的查詢結果時,所述用戶不僅能夠得到用戶查詢序列本身所對應的查詢結果, 還能夠得到經糾錯處理後的糾錯序列所對應的查詢結果,因而用戶可以根據自身需求來選擇查看所述查詢序列或所述糾錯序列對應的查詢結果。例如,當利用所述步驟Si』所獲取的候選糾錯序列的糾錯相關度均不高,並通過所述步驟S2』將所有的候選糾錯序列作為糾錯序列時,在所述步驟S3』中,所述糾錯設備通過搜索索引庫中的匹配查詢而得到所有糾錯序列對應的查詢結果,在此情形下,通過所述步驟S4,提供所述查詢序列對應的查詢結果, 可使用戶將該查詢序列的查詢結果與所有糾錯序列的查詢結果進行比較,以選擇查看基於糾錯前的查詢序列或糾錯後的糾錯序列得到的查詢結果,提升了用戶的搜索體驗。本領域技術人員應能理解上述將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備的方式僅為舉例,其他現有的或今後可能出現的將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備的方式如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。在另一個優選實施例中(參照圖4),所述步驟S4』中,所述糾錯設備還基於預設提供規則,將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備;其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶設備-所述查詢結果的提供區域;-所述查詢結果的邊界標註;-所述查詢結果的顯示顏色;-所述查詢結果的提供順序。以所述查詢結果的提供區域為例,所述糾錯設備根據所述查詢結果的提供區域將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備,例如,將所述糾錯序列相對應的查詢結果提供在用戶設備的瀏覽器的左側,而將所述查詢序列相對應的查詢結果提供在用戶設備的瀏覽器的右側。以所述查詢結果的邊界標註為例,所述糾錯設備根據所述查詢結果的邊界標註將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備。例如,所述糾錯設備將這些查詢結果提供給用戶設備時,在不同的查詢結果之間進行邊界標註,以明確表明邊界相對兩側的查詢結果來自於糾錯序列或查詢序列。以所述查詢結果的顯示顏色為例,所述糾錯設備根據所述查詢結果的顯示顏色將與所述糾錯序列相對應的查詢結果以及與所述查詢序列相對應的查詢結果提供至所述用戶設備。以所述查詢結果的提供順序為例,所述糾錯設備在提供所述糾錯序列相對應的查詢結果以及所述查詢序列相對應的查詢結果時,先提供所述查詢序列的查詢結果隨後提供所述糾錯序列相對應的查詢結果,或者,先提供糾錯序列相對應的查詢結果隨後提供所述查詢序列的查詢結果。在此,所述糾錯設備通過搜尋引擎等第三方設備提供的應用程式接口(API)或其他約定的提供方式,從該第三方設備獲取上述預設提供規則,或者,通過對搜尋引擎的搜索日誌進行統計分析,獲取上述預設提供規則。本領域技術人員應能理解上述預設提供規則僅為舉例,其他現有的或今後可能出現的預設提供規則如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。優選地,在所述步驟S4』中,所述糾錯設備還提供與所述糾錯序列相對應的所述糾錯相關度以及所述糾錯序列相對應的查詢結果至所述用戶設備。具體地,所述糾錯設備在提供所述糾錯序列相對應的查詢結果時,通過頁面技術,如JSP、ASP或PHP等,將與所述糾錯序列相對應的糾錯相關度與所述查詢結果一併提供給用戶設備。採用該提供方式,本發明在將糾錯相關度和查詢結果提供給用戶設備時,用戶還可以藉助於糾錯相關度來確定搜尋引擎對於當前輸入的查詢序列的糾錯準確率,進一步增強了用戶與搜尋引擎之間的交互體驗。對於本領域技術人員而言,顯然本發明不限於上述示範性實施例的細節,而且在不背離本發明的精神或基本特徵的情況下,能夠以其他的具體形式實現本發明。因此,無論從哪一點來看,均應將實施例看作是示範性的,而且是非限制性的,本發明的範圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和範圍內的所有變化囊括在本發明內。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。此外,顯然「包括」 一詞不排除其他單元或步驟,單數不排除複數。系統權利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟體或者硬體來實現。第一,第二等詞語用來表示名稱,而並不表示任何特定的順序。
權利要求
1.一種計算機實現的用於對查詢序列進行糾錯的方法,其中,該方法包括以下步驟 a獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;b根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;c根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果; d將所述查詢結果提供至所述用戶設備。
2.根據權利要求1所述的方法,其中,所述步驟a還包括-根據所述查詢序列,結合預設糾錯規則,獲取所述候選糾錯序列。
3.根據權利要求2所述的方法,其中,所述預設糾錯規則基於以下至少任一項 -所述查詢序列的同音匹配;-所述查詢序列的模糊音匹配; -所述查詢序列的形近字匹配; -與所述查詢序列相對應的編輯距離閾值。
4.根據權利要求1至3中任一項所述的方法,其中,所述方法還包括-基於預設的相關度規則,根據所述候選糾錯序列,獲取所述候選糾錯序列的糾錯相關度。
5.根據權利要求4所述的方法,其中,所述預設的相關度規則包括基於以下至少任一項來獲取所述候選糾錯序列的糾錯相關度-所述查詢序列與所述候選糾錯序列的共現頻率; -所述查詢序列與所述候選糾錯序列之間的共現詞數量; -所述候選糾錯序列的查詢次數;-所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度。
6.根據權利要求1至5中任一項所述的方法,其中,所述步驟b還包括-根據所述候選糾錯序列的糾錯相關度,對所述候選糾錯序列進行排序,以獲取所述經排序的候選糾錯序列;-從所述經排序的候選糾錯序列中選取所述糾錯序列。
7.根據權利要求1至6中任一項所述的方法,其中,所述步驟b還包括-根據所述候選糾錯序列的糾錯相關度,結合預設的糾錯相關度閾值,確定與所述候選糾錯序列相對應的糾錯等級;-根據所述糾錯等級,從所述候選糾錯序列中選取所述糾錯序列。
8.根據權利要求1至7中任一項所述的方法,其中,該方法還包括 -根據所述查詢序列,獲取與所述查詢序列相對應的查詢結果;其中,所述步驟d還包括-將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備。
9.根據權利要求1至8中任一項所述的方法,其中,所述步驟d還包括-基於預設提供規則,將與所述糾錯序列相對應的查詢結果提供至所述用戶設備; 其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶-所述查詢結果的提供區域; -所述查詢結果的邊界標註; -所述查詢結果的顯示顏色; -所述查詢結果的提供順序。
10.根據權利要求1至9中任一項所述的方法,其中,所述步驟d還包括-將與所述糾錯序列相對應的所述糾錯相關度以及所述查詢結果提供至所述用戶設備。
11.一種用於對查詢序列進行糾錯的設備,其中,所述設備包括第一獲取裝置,用於獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;選取裝置,用於根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;第二獲取裝置,用於根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果; 提供裝置,用於將所述查詢結果提供至所述用戶設備。
12.根據權利要求11所述的設備,其中,所述第一獲取裝置還用於 -根據所述查詢序列,結合預設糾錯規則,獲取所述候選糾錯序列。
13.根據權利要求12所述的設備,其中,所述預設糾錯規則基於以下至少任一項 -所述查詢序列的同音匹配;-所述查詢序列的模糊音匹配; -所述查詢序列的形近字匹配; -與所述查詢序列相對應的編輯距離閾值。
14.根據權利要求11至13中任一項所述的設備,其中,所述設備還包括第三獲取裝置, 用於-基於預設的相關度規則,根據所述候選糾錯序列,獲取所述候選糾錯序列的糾錯相關度。
15.根據權利要求14所述的設備,其中,所述預設的相關度規則包括基於以下至少任一項來獲取所述候選糾錯序列的糾錯相關度-所述查詢序列與所述候選糾錯序列的共現頻率; -所述查詢序列與所述候選糾錯序列之間的共現詞數量; -所述候選糾錯序列的查詢次數;-所述查詢序列的查詢結果與所述候選糾錯序列的查詢結果的匹配度。
16.根據權利要求11至15中任一項所述的設備,其中,所述選取裝置還用於-根據所述候選糾錯序列的糾錯相關度,對所述候選糾錯序列進行排序,以獲取經排序的所述候選糾錯序列;-從所述經排序的候選糾錯序列中選取所述糾錯序列。
17.根據權利要求11至16中任一項所述的設備,其中,所述選取裝置還用於-根據所述候選糾錯序列的糾錯相關度,結合預設的糾錯相關度閾值,確定與所述候選糾錯序列相對應的糾錯等級;-根據所述糾錯等級,從所述候選糾錯序列中選取所述糾錯序列。
18.根據權利要求11至17中任一項所述的設備,其中,所述設備還包括第四獲取裝置, 用於-根據所述查詢序列,獲取與所述查詢序列相對應的查詢結果; 其中,所述提供裝置還用於-將與所述查詢序列相對應的查詢結果以及與所述糾錯序列相對應的查詢結果提供至所述用戶設備。
19.根據權利要求11至18中任一項所述的設備,其中,所述提供裝置還用於-基於預設提供規則,將與所述糾錯序列相對應的查詢結果提供至所述用戶設備; 其中,所述預設提供規則包括基於以下至少任一項將所述查詢結果提供給所述用戶設備-所述查詢結果的提供區域; -所述查詢結果的邊界標註; -所述查詢結果的顯示顏色; -所述查詢結果的提供順序。
20.根據權利要求11至19中任一項所述的設備,其中,所述提供裝置還用於 -將與所述糾錯序列相對應的所述糾錯相關度以及所述查詢結果提供至所述用戶設備。
21.一種搜尋引擎,其中,該搜尋引擎包括如權利要求11至20中任一項所述的用於對查詢序列進行糾錯的設備。
全文摘要
本發明提供一種用於基於糾錯相關度對查詢序列進行糾錯的設備和方法,包括獲取與用戶通過用戶設備輸入的查詢序列相對應的候選糾錯序列;根據所述候選糾錯序列的糾錯相關度,從所述候選糾錯序列中選取與所述查詢序列相對應的糾錯序列;根據所述糾錯序列,獲取與所述糾錯序列相對應的查詢結果;將所述查詢結果提供至所述用戶設備。與現有技術相比,本發明通過候選糾錯序列的糾錯相關度來合理地選擇對應的糾錯序列,並將所述糾錯序列對應的查詢結果提供給用戶,既提高了搜尋引擎對於用戶輸入的查詢序列的糾錯準確率,又增強了用戶與搜尋引擎之間的交互性,進而提升了用戶的搜索體驗。
文檔編號G06F17/30GK102163234SQ20111009805
公開日2011年8月24日 申請日期2011年4月19日 優先權日2011年4月19日
發明者仙雲森 申請人:北京百度網訊科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀