新四季網

一種基於搜索信息向用戶提供網站選擇的方法、裝置和系統的製作方法

2023-09-18 17:38:20

專利名稱:一種基於搜索信息向用戶提供網站選擇的方法、裝置和系統的製作方法
技術領域:
本發明涉及網際網路領域,尤其涉及一種基於搜索信息向用戶提供網站選擇的方法、裝置和系統。
背景技術:
信息搜索,尤其是基於移動通信的信息搜索,在用戶使用移動終端時是是非常重要的需求之一。然而,現在有能力提供搜索服務的網站,為了讓自己在產業鏈的競爭中更加具有優勢,往往彼此之間互相屏蔽信息。於是,用戶常常為了獲取期望的搜索信息在各種渠道/網站中進行搜索。例如,為了獲取購物信息,不得不到專門的購物網站上搜索;為了獲取餐館信息,不得不到專門的餐飲類網站上搜索,為了獲取影視信息,不得不到專門的影視類網站上進行搜索;等等。甚至,用戶的搜索意圖也會發生變化,這可能導致用戶選擇的搜索渠道可能並不能達到其目的,這又需要用戶重新考慮並選擇另外的渠道進行信息獲取。因此,用戶常常在多個搜索渠道中進行頻繁切換,而訪問過程又非常繁瑣和機械。常見的情況是,用戶最後沒有獲得自己真正需要的信息,還耗費了大量的時間和精力,是一種非常不愉快的用戶體驗。因此,迫切需要一種能夠基於用戶輸入的搜索信息向用戶提供與搜索信息密切相關的多種搜索渠道/相關網站以供用戶在其中做出選擇的方法和裝置,以減輕用戶的負擔。

發明內容
本發明的目的是提供一種能克服上述缺陷的基於搜索信息向用戶提供網站選擇的方法、裝置和系統。在本發明的第一方面,提供了一種基於搜索信息向用戶提供網站選擇的方法,包括對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在本發明的第二方面,提供了一種基於搜索信息向用戶提供網站選擇的裝置,包括分詞模塊,用於對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;網站列表生成模塊,用於在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及分類模塊,對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在本發明的第三方面,提供了一種用戶終端,包括分詞模塊,用於對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;網站列表生成模塊,用於在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及分類模塊,對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在本發明的第四方面,提供了一種伺服器,包括分詞模塊,用於對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;網站列表生成模塊,用於在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及分類模塊,對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在本發明的第五方面,提供了一種基於搜索信息向用戶提供網站選擇的系統,包括分詞模塊,用於對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;網站列表生成模塊,用於在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;分類模塊,對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站;以及用戶終端,用於將所述搜索信息發送給伺服器並且從所述伺服器接收所述分類網站列表以便於用戶對其中的網站進行選擇,並且用於將用戶的選擇信息發送給伺服器並且從所述伺服器接收所述搜索結果。本發明基於用戶輸入的搜索信息和預先建立的索引資料庫,向用戶提供與搜索信息密切相關的多個規律排列的搜索渠道/網站以供選擇,進而根據用戶對網站的選擇將該網站中的搜索結果返回給用戶。本發明節省了用戶搜索期望信息的時間,提高了搜索效率,改善了用戶體驗。


圖1是根據本發明實施例的基於搜索信息向用戶提供網站選擇的流程圖;圖2是根據本發明實施例的建立索引資料庫的方法流程圖;圖3是根據本發明實施例的基於搜索信息向用戶提供網站選擇的示意圖;圖4是根據本發明實施例的基於搜索信息向用戶提供網站選擇的裝置的示意圖;以及。圖5是根據本發明實施例的基於搜索信息向用戶提供網站選擇的系統的示意圖。
具體實施例方式下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。本發明通過根據網站數據集在網際網路上進行數據收集並建立索引,然後根據藉助索引對用戶的搜索信息進行處理,將與該搜索信息相關的網站以一定規律分發在用戶終端的屏幕上。圖1是根據本發明實施例的基於搜索信息向用戶提供網站選擇的方法流程圖。
在步驟101,用戶在用戶終端上輸入搜索信息,這些搜索信息中含有用戶的搜索意圖,該意圖預期可以通過訪問網際網路上的網站而得到結果。在步驟101之後,流程分為兩路,一路執行步驟103、105、和107,另一路執行步驟102、104、和 106。在步驟103,通過預先建立的分詞詞庫對該搜索信息進行分詞處理,得到一個或多個關鍵詞。在步驟105,通過在索引資料庫中以這些關鍵詞進行檢索,得到包含與這些關鍵詞對應的一個或多個網站的第一網站列表。在步驟107,根據索引資料庫中網站的屬性,對第一網站列表中的網站進行分類。分類後的網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在步驟102,對用戶輸入的搜索信息進行語義分析。在步驟104,根據語義分析的結果和預定義規則得到第二網站列表。舉例來說,可以利用分詞詞庫對搜索信息進行分詞,然後用預定義規則對分詞結果進行判斷,從而得到在預定義規則中與分詞結果對應的一些網站。在步驟106,根據索引資料庫中網站的屬性,對第二網站列表中的網站進行分類。分類後的網站列表包含一個或多個分類,每個分類中包含一個或多個網站。此路的目的在於給出一個預先判斷,以便彌補或豐富另一路的網站列表的內容。在步驟108,將分類之後的第一網站列表和第二網站列表進行合併,其中,同一分類的網站被合併。合併後的網站列表包含一個或多個分類,每個分類中包含一個或多個網站。在步驟109,對合併後的網站中的各個分類進行排序,並且對每一分類中的各個網站進行排序,以便於用戶對其中的網站進行選擇。在初始狀態下可以按照簡單規則對分類和分類中的網站執行一個初始排序;隨後,可以通過對關鍵詞和用戶對網站的選擇進行統計和概率計算,為分類中的網站排序。用戶可以很方便地根據該網站列表選擇其中的網站來獲得期望的搜索結果。例如,可以按照網站列表中分類間以及分類中網站間的排序,將該網站列表以諸如圖標的形式顯示在用戶終端的顯示屏上。用戶通過點擊圖標選擇網站以獲得與輸入的搜索信息相關的搜索結果。例如,根據用戶輸入的搜索信息「哈利波特」可以得到排序後的相關網站列表。如果用戶想獲得電影信息,則可以在列表中選擇「影視」分類中的網站;如果用戶想閱覽小說,則可以在列表中選擇「小說」分類中的網站;如果用戶想購買實體書籍,則可以在列表中選擇「書籍」或「網購」分類中的網站。這樣,根據用戶輸入的搜索信息,將與該搜索信息相關的網站分門別類地提供給用戶以供其選擇,消除了用戶在多個搜索渠道中進行訪問/切換的煩惱。在步驟110,根據用戶對排序後的分類網站列表中的網站的選擇,向用戶提供該搜索信息在被選擇網站中的搜索結果。當用戶選擇列表中的網站時,用戶輸入的搜索信息被推送到用戶所選擇的網站,然後將該搜索信息在該網站中的搜索結果返回給用戶。如上所述,用戶搜索信息的關鍵詞以及用戶對網站的選擇被統計並用於概率計算,以便在初始狀態之後對分類中的網站進行排序。在本發明的另一個實施例中,步驟102、104、106和108可以不存在,在步驟109直接對分類的第一網站列表中各分類以及各個分類中的網站進行排序。圖2是根據本發明實施例的建立索引資料庫的流程圖。
按照預定義規則,根據網站數據在網站中進行網頁的抓取。例如,可以根據內容管理系統(CMS)中的網站數據集和其中定義的規則,選取其中的一些網站,對這些網站中的網頁進行抓取。每個網站數據包括該網站對應的連結和該網站的類別,網站類別例如可以分為如網購、小說、影視、書籍等等,一個網站可以對應一個或多個網站類別。從抓取的網頁中提取出關鍵欄位,關鍵欄位可以是網頁的標題或者是其他重要的附加信息。然後,通過分詞詞庫對關鍵欄位進行分詞處理,從中提取出關鍵詞。在初始階段,分詞詞庫中包含有一定規模的分詞數據。在關鍵詞提取出來之後,還可以進一步對其進行優化處理。例如,可以按照網站類另IJ,對關鍵詞進行歸併。因為很可能存在這種情況,即在從網站抓取的多數網頁中都出現了兩個或多個特定關鍵詞的相同組合,為了減小隨後建立的索引的規模並且提高檢索索引的效率,需要將這些重複出現的組合關鍵詞歸併為一個關鍵詞。歸併標準可以通過預先設定閾值來判斷,即如果兩個或多個關鍵詞的組合在網頁中的出現頻率超過該預定閾值,則將該組合歸併為一個關鍵詞。在這之後,還可以從提取出的若干關鍵詞提取一些在網頁中出現頻率超過預定閾值的關鍵詞,將這些所謂的高頻關鍵詞併入到分詞詞庫中,以提高分詞效率。最終,根據關鍵詞的最終結果建立關鍵詞_>網站的索引資料庫,索引中的每個網站具有網站類別的屬性以指明其屬於一個或多個網站類別,並且其中,一個關鍵詞可以對應一個或多個網站。圖3是根據本發明實施例的向用戶提供網站訪問的方法流程圖。在前處理中,根據分詞詞庫對用戶輸入的搜索信息進行分詞處理得到分詞結果。該搜索信息可以來自於用戶直接輸入的文字和/或符號,也可以是將用戶語音進行識別後轉換而成的。然後,通過預定義的一些特殊規則對分詞結果進行判斷,預定義規則包括了分詞結果與一些網站的對應關係,通過判斷得出一系列網站,其中,這些網站各自歸屬於一個或多個網站類別。通過對這些網站進行分類可以得到網站列表I。網站列表I包含一個或多個網站類別,每個網站類別中包含一個或多個網站。例如,用戶輸入「哪裡」、「電影」、「價格」這些一般不體現具體意義的詞,通過預定義規則,則可以在該網站列表I中給出「旅遊」、「影視」、「購物」 一類的網站。簡言之,前處理是根據用戶輸入進行語義分析,從而針對潛在的用戶目的給出一個預先判斷,進而給出一個有針對性的網站列表。在關鍵詞-網站的索引中檢索分詞結果,得到分詞結果在索引中對應的一系列網站。根據索引中網站的網站類別屬性,對這一系列網站進行分類,最終得到網站列表2。網站列表2包含一個或多個網站類別,每個網站類別中包含一個或多個網站。簡言之,檢索索引是一個較之上述的前處理更為精確的處理,得到的是一個能夠在索引中有據可緣的網站列表。然後,將網站列表I和網站列表2進行合併得到網站列表3,同一類別的網站被合併在一個網站類別中。網站列表I可以對網站列表2起補充/豐富的作用。當然,網站列表3包含一個或多個網站類別,每個網站類別中包含一個或多個網站。在後處理中,對網站列表3進行優先級排序,包括對網站類別進行排序以及對一個網站類別中的多個網站進行排序。下面詳細描述優先級排序的處理過程。在初始狀態下將執行一個初始排序。在初始排序中,對網站類別的排序可以按照小流量優先的原則進行,即按照網站流量進行排序,流量越小的網站類別的排序越靠前;對同一網站類別中的若干網站的排序可以按照訪問速度、內容完備性、易用性等指標以一定規則對網站進行評分,評分靠前的網站的排序靠前。接下來,按照用戶輸入的分詞結果對同一網站類別中的若干網站進行排序。設用戶輸入的分詞結果為il,i2, i3,. . .,in,則在最後得出的網站列表中的一個網站類別中,網站S的顯示優先級可以通過下列公式來計算,優先級越高的網站在一個網站類別中排序越靠前。優先級=初始權重*a+ ((Pr (S | i I) + (Pr (S | i2) + + (Pr (S | in)) *b在上面的公式中,(Pr(S|A)為在用戶輸入的分詞結果包含關鍵詞A的情況下,用戶選擇網站S的頻率;初始權重為預先設定的值;a和b為調整係數,其初始值可以分別為0. 5,並且可以使用統計分析模型不斷優化,統計分析模型例如可以是隱馬爾可夫模型(Hidden Markov Model, HMM)。(Pr (S| A) =Pr (A |S) *Pr (S)/Pr(A),其中,Pr (A | S)是用戶選擇網站 S 的情況下,用戶輸入的分詞結果包含關鍵詞A的概率,Pr(S)是用戶選擇網站S的概率,Pr(A)是用戶輸入的分詞結果包含關鍵詞A的概率,最後,按照後處理的結果將網站列表3提供給用戶,例如將排序後的網站列表3顯示在用戶終端的顯示屏上,以供用戶對其中的網站進行選擇訪問。這樣,用戶通過輸入搜索信息,就可以得到一個與該搜索信息相關的網站列表,並且該網站列表是按照一定規律排列顯示的。用戶通過直觀的判斷,可以方便地選擇最期望的網站查看搜索結果。圖4是根據本發明實施例的基於搜索信息向用戶提供網站選擇的裝置的示意圖。如圖4中所示,網頁抓取模塊、關鍵欄位提取模塊、第一分詞模塊和索引資料庫建立模塊用於建立索引資料庫。在本發明的另一個實施例中,上述模塊可以存在於裝置之外,即事先在裝置之外已建立好索引資料庫並將其存儲在裝置中。網頁抓取模塊按照預定義規則,根據網站數據在網站中進行網頁的抓取。例如,可以根據內容管理系統(CMS )中的網站數據集和其中定義的規則,選取其中的一些網站,對這些網站中的網頁進行抓取。每個網站數據包括該網站對應的連結和該網站的類別,網站類別例如可以分為如網購、小說、影視、書籍等等,一個網站可以對應一個或多個網站類別。關鍵欄位提取模塊從抓取的網頁中提取出關鍵欄位,關鍵欄位可以是網頁的標題或者是其他重要的附加信息。然後,第一分詞模塊通過分詞詞庫對關鍵欄位進行分詞處理,從中提取出關鍵詞。在初始階段,分詞詞庫中包含有一定規模的分詞數據。在關鍵詞提取出來之後,還可以進一步對其進行優化處理。例如,可以按照網站類另IJ,對關鍵詞進行歸併。因為很可能存在這種情況,即在從網站抓取的多數網頁中都出現了兩個或多個特定關鍵詞的相同組合,為了減小隨後建立的索引的規模並且提高檢索索引的效率,需要將這些重複出現的組合關鍵詞歸併為一個關鍵詞。歸併標準可以通過預先設定閾值來判斷,即如果兩個或多個關鍵詞的組合在網頁中的出現頻率超過該預定閾值,則將該組合歸併為一個關鍵詞。在這之後,還可以從提取出的若干關鍵詞提取一些在網頁中出現頻率超過預定閾值的關鍵詞,將這些所謂的高頻關鍵詞併入到分詞詞庫中,以提高分詞效率。
最終,索引資料庫建立模塊根據關鍵詞的最終結果建立關鍵詞_>網站的索引資料庫,索引中的每個網站具有網站類別的屬性以指明其屬於一個或多個網站類別,並且其中,一個關鍵詞可以對應一個或多個網站。還如圖4中所示,第二分詞模塊、語義分析模塊、網站列表生成模塊、合併模塊、分類模塊、排序模塊和搜索結果提供模塊用於基於用戶輸入的搜索信息和索引資料庫向用戶提供網站選擇並將被選擇網站的搜索結果返回給用戶。當用戶輸入搜索信息時,第二分詞模塊通過預先建立的分詞詞庫對該搜索信息進行分詞處理,得到一個或多個關鍵詞。語義分析模塊對用戶輸入的搜索信息進行語義分析,得到語義分析結果。一方面,網站列表生成模塊通過在索引資料庫中以這些關鍵詞進行檢索,得到包含與這些關鍵詞對應的一個或多個網站的第一網站列表;另一方面,網站列表生成模塊根據語義分析的結果和預定義規則得到第二網站列表。分類模塊根據索引資料庫中網站的屬性,對第一網站列表和第二網站列表中的網站進行分類。接下來,合併模塊將分類之後的第一網站列表和第二網站列表進行合併,其中,同一分類的網站被合併。合併後的網站列表包含一個或多個分類,每個分類中包含一個或多個網站。應當指出,合併模塊和分類模塊的執行不限於上述的時序關係,還可以先合併再分類。排序模塊對合併後的網站中的各個分類進行排序,並且對每一分類中的各個網站進行排序,以便於用戶對其中的網站進行選擇。在初始狀態下可以按照簡單規則對分類和分類中的網站執行一個初始排序;隨後,可以通過對關鍵詞和用戶對網站的選擇進行統計和概率計算,為分類中的網站排序。搜索結果提供模塊根據用戶對排序後的分類網站列表中的網站的選擇,向用戶提供該搜索信息在被選擇網站中的搜索結果。當用戶選擇列表中的網站時,用戶輸入的搜索信息被推送到用戶所選擇的網站,然後將該搜索信息在該網站中的搜索結果返回給用戶。如上所述,用戶搜索信息的關鍵詞以及用戶對網站的選擇被統計並用於概率計算,以便在初始狀態之後對分類中的網站進行排序。應當指出,第一分詞模塊和第二分詞模塊可以是同一分詞模塊也可以是不同的分詞模塊,這取決於建立索引資料庫的模塊群的位置以及系統效率考慮。在本發明的另一個實施例中,可以不進行語義分析而只基於索引資料庫建立第一網站列表,因此語義分析模塊和合併模塊可以不存在,網站列表建立模塊和分類模塊的功能也相應地簡化。圖5是根據本發明實施例的基於搜索信息向用戶提供網站選擇的系統的示意圖。伺服器包括網頁抓取模塊、關鍵欄位提取模塊、分詞模塊和索引資料庫建立模塊,用於建立索引資料庫。網頁抓取模塊按照預定義規則,根據網站數據在網站中進行網頁的抓取。例如,可以根據內容管理系統(CMS )中的網站數據集和其中定義的規則,選取其中的一些網站,對這些網站中的網頁進行抓取。每個網站數據包括該網站對應的連結和該網站的類別,網站類別例如可以分為如網購、小說、影視、書籍等等,一個網站可以對應一個或多個網站類別。關鍵欄位提取模塊從抓取的網頁中提取出關鍵欄位,關鍵欄位可以是網頁的標題或者是其他重要的附加信息。然後,分詞模塊通過分詞詞庫對關鍵欄位進行分詞處理,從中提取出關鍵詞。在初始階段,分詞詞庫中包含有一定規模的分詞數據。在關鍵詞提取出來之後,還可以進一步對其進行優化處理。例如,可以按照網站類另IJ,對關鍵詞進行歸併。因為很可能存在這種情況,即在從網站抓取的多數網頁中都出現了兩個或多個特定關鍵詞的相同組合,為了減小隨後建立的索引的規模並且提高檢索索引的效率,需要將這些重複出現的組合關鍵詞歸併為一個關鍵詞。歸併標準可以通過預先設定閾值來判斷,即如果兩個或多個關鍵詞的組合在網頁中的出現頻率超過該預定閾值,則將該組合歸併為一個關鍵詞。在這之後,還可以從提取出的若干關鍵詞提取一些在網頁中出現頻率超過預定閾值的關鍵詞,將這些所謂的高頻關鍵詞併入到分詞詞庫中,以提高分詞效率。最終,索引資料庫建立模塊根據關鍵詞的最終結果建立關鍵詞_>網站的索引資料庫,索引中的每個網站具有網站類別的屬性以指明其屬於一個或多個網站類別,並且其中,一個關鍵詞可以對應一個或多個網站。伺服器還包括語義分析模塊、網站列表生成模塊、合併模塊、分類模塊、排序模塊和搜索結果提供模塊用於基於用戶輸入的搜索信息和索引資料庫向用戶提供網站選擇並將被選擇網站的搜索結果返回給用戶。用戶通過用戶終端輸入的搜索信息通過網絡被發送到伺服器,分詞模塊通過預先建立的分詞詞庫對該搜索信息進行分詞處理,得到一個或多個關鍵詞。語義分析模塊對用戶輸入的搜索信息進行語義分析,得到語義分析結果。一方面,網站列表生成模塊通過在索引資料庫中以這些關鍵詞進行檢索,得到包含與這些關鍵詞對應的一個或多個網站的第一網站列表;另一方面,網站列表生成模塊根據語義分析的結果和預定義規則得到第二網站列表。分類模塊根據索引資料庫中網站的屬性,對第一網站列表和第二網站列表中的網站進行分類。接下來,合併模塊將分類之後的第一網站列表和第二網站列表進行合併,其中,同一分類的網站被合併。合併後的網站列表包含一個或多個分類,每個分類中包含一個或多個網站。應當指出,合併模塊和分類模塊的執行不限於上述的時序關係,也可以先合併然後分類。排序模塊對合併後的網站中的各個分類進行排序,並且對每一分類中的各個網站進行排序。然後,排序後的網站列表通過網絡被發送到用戶終端,以便於用戶對其中的網站進行選擇。在初始狀態下可以按照簡單規則對分類和分類中的網站執行一個初始排序;隨後,可以通過對關鍵詞和用戶對網站的選擇進行統計和概率計算,為分類中的網站排序。在用戶對列表中的網站做出選擇之後,其選擇信息通過網絡被發送到伺服器。月艮務器中的搜索結果提供模塊接收用戶對排序後的分類網站列表中的網站的選擇信息,根據選擇信息將搜索信息推送到用戶選擇的網站,獲得將該搜索信息在該網站中的搜索結果並將其通過網絡返回給用戶終端。如上所述,用戶搜索信息的關鍵詞以及用戶對網站的選擇被統計並用於概率計算,以便在初始狀態之後對分類中的網站進行排序。專業人員應該還可以進一步意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬體、計算機軟體或者二者的結合來實現,為了清楚地說明硬體和軟體的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬體還是軟體方式來執行,取決於技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出本發明的範圍。結合本文中所公開的實施例描述的方法或算法的步驟可以用硬體、處理器執行的軟體模塊,或者二者的結合來實施。軟體模塊可以置於隨機存儲器(RAM)、內存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬碟、可移動磁碟、CD-ROM、或技術領域內所公知的任意其它形式的存儲介質中。以上所述的具體實施方式
,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式
而已,並不用於限定本發明的保護範圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護範圍之內。
權利要求
1.一種基於搜索信息向用戶提供網站選擇的方法,包括 對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞; 在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及 對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。
2.根據權利要求1所述的方法,還包括 對所述分類網站列表中的一個或多個分類進行排序並且對所述每個分類中的網站進行排序,得到排序後的分類網站列表以便於用戶對其中的網站進行選擇。
3.根據權利要求1所述的方法,還包括 對用戶輸入的搜索信息進行語義分析; 根據語義分析的結果和預定義規則得到第二網站列表,所述第二網站列表包含一個或多個網站; 對所述第二網站列表中的網站進行分類得到預判網站列表,所述預判網站列表包含一個或多個分類,每個分類中包含一個或多個網站;以及 將所述預判網站列表與所述分類網站列表合併以便於用戶對其中的網站進行選擇。
4.根據權利要求2所述的方法,其中,對所述每個分類中的網站進行排序的步驟包括 統計在所述一個或多個關鍵詞中的一個關鍵詞通過分詞得到的情況下,用戶選擇訪問所述每個分類中的一個網站的概率; 根據與所述一個或多個關鍵詞中的所有關鍵詞對應的一個或多個所述概率,計算所述一個網站在每個分類中的排序優先級;以及 根據所述排序優先級對每個分類中的網站進行排序。
5.根據權利要求1所述的方法,還包括 根據用戶對所述分類網站列表中的網站的選擇信息,向用戶提供所述搜索信息在被選擇網站中的搜索結果。
6.根據權利要求1所述的方法,還包括 通過網絡從多個網站上抓取網頁; 從抓取的網頁中提取出多個關鍵欄位; 根據預先建立的分詞詞庫對所述多個關鍵欄位進行分詞得到多個關鍵詞;以及根據所述多個關鍵詞與所述多個網站的對應關係建立所述索引資料庫,其中所述索引資料庫中的一個關鍵詞對應一個或多個網站。
7.根據權利要求6所述的方法,還包括 將所述多個關鍵詞中的兩個或多個關鍵詞歸併為一個關鍵詞,所述兩個或多個關鍵詞的組合在網頁中的出現頻率超過預定閾值。
8.根據權利要求6所述的方法,還包括 將所述多個關鍵詞中的高頻關鍵詞併入所述分詞詞庫,所述高頻關鍵詞是在所述網頁中的出現頻率超過預定閾值的關鍵詞。
9.一種基於搜索信息向用戶提供網站選擇的裝置,包括 分詞模塊,用於對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;網站列表生成模塊,用於在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及 分類模塊,對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。
10.根據權利要求9所述的裝置,還包括 排序模塊,用於對所述分類網站列表中的一個或多個分類進行排序並且對所述每個分類中的網站進行排序,得到排序後的分類網站列表以便於用戶對其中的網站進行選擇。
11.根據權利要求9所述的裝置,還包括 語義分析模塊,用於對用戶輸入的搜索信息進行語義分析; 其中,所述網站列表生成模塊還用於根據語義分析的結果和預定義規則得到第二網站列表,所述第二網站列表包含一個或多個網站,所述分類模塊還用於對所述第二網站列表中的網站進行分類得到預判網站列表,所述預判網站列表包含一個或多個分類,每個分類中包含一個或多個網站;以及 合併模塊,還用於將所述預判網站列表與所述分類網站列表合併以便於用戶對其中的網站進行選擇。
12.根據權利要求9所述的裝置,所述分類模塊包括 用於統計在所述一個或多個關鍵詞中的一個關鍵詞通過分詞得到的情況下,用戶選擇訪問所述每個分類中的一個網站的概率的模塊; 用於根據與所述一個或多個關鍵詞中的所有關鍵詞對應的一個或多個所述概率,計算所述一個網站在每個分類中的排序優先級的模塊;以及 用於根據所述排序優先級對每個分類中的網站進行排序的模塊。
13.根據權利要求9所述的裝置,還包括 搜索結果提供模塊,用於根據用戶的選擇信息,向用戶提供所述搜索信息在被選擇網站中的搜索結果。
14.根據權利要求9所述的裝置,還包括 網頁抓取模塊,用於通過網絡從多個網站上抓取網頁; 關鍵欄位提取模塊,用於從抓取的網頁中提取出多個關鍵欄位; 其中,所述分詞模塊還用於根據預先建立的分詞詞庫對所述多個關鍵欄位進行分詞得到多個關鍵詞;以及 索引資料庫建立模塊,用於根據所述多個關鍵詞與所述多個網站的對應關係建立所述索弓I資料庫,其中,所述索弓I資料庫中的一個關鍵詞對應一個或多個網站。
15.根據權利要求14所述的裝置,還包括 用於將所述多個關鍵詞中的兩個或多個關鍵詞歸併為一個關鍵詞的模塊,所述兩個或多個關鍵詞的組合在網頁中的出現頻率超過預定閾值。
16.根據權利要求14所述的裝置,還包括 用於將所述多個關鍵詞中的高頻關鍵詞併入所述分詞詞庫的模塊,所述高頻關鍵詞是在所述網頁中的出現頻率超過預定閾值的關鍵詞。
17.一種用戶終端,包括如權利要求9-16之一所述的基於搜索信息向用戶提供網站選擇的裝置。
18.一種伺服器,包括如權利要求9-16之一所述的基於搜索信息向用戶提供網站選擇的裝置。
19.一種基於搜索信息向用戶提供網站選擇的系統,包括如權利要求18所述的伺服器和用戶終端,所述用戶終端用於將所述搜索信息發送給伺服器並且從所述伺服器接收所述分類網站列表以便於用戶對其中的網站進行選擇,所述用戶終端還用於將用戶的選擇信息發送給伺服器並且從所述伺服器接收所述搜索結果。
全文摘要
本發明涉及一種基於搜索信息向用戶提供網站選擇的方法、裝置及系統,該方法包括對用戶輸入的搜索信息進行分詞得到一個或多個關鍵詞;在預先建立的索引資料庫中檢索所述關鍵詞得到第一網站列表,所述第一網站列表包含與所述一個或多個關鍵詞對應的一個或多個網站;以及對所述第一網站列表中的網站進行分類得到分類網站列表以便於用戶對其中的網站進行選擇,所述分類網站列表包含一個或多個分類,每個分類中包含一個或多個網站。本發明向用戶提供與搜索信息密切相關的多個規律排列的搜索渠道/網站以供選擇,進而根據用戶選擇將該網站中的搜索結果返回給用戶。本發明節省了用戶的搜索時間,提高了搜索效率,改善了用戶體驗。
文檔編號G06F17/30GK103064880SQ20121048444
公開日2013年4月24日 申請日期2012年11月23日 優先權日2012年11月23日
發明者覃文浩, 韓慶, 譚真, 王皓 申請人:覃文浩, 韓慶, 譚真, 王皓

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀