查詢結果排序方法及裝置的製作方法
2023-07-24 21:06:01 1
專利名稱:查詢結果排序方法及裝置的製作方法
技術領域:
本申請涉及數據處理領域,尤其涉及一種查詢結果排序方法及裝置。
背景技術:
現有技術中提供一種用於網上交易系統中的排序方法基於相關性和市場機制,即通過信息的相關性以及商業因素來影響排序。例如可以通過信息質量、供應商因素等影響排序。這種方法的核心是根據查詢結果的相關性和商業因素來排序,它的缺點是排序結果不能很好滿足買家需求。因為這種排序方法產生的排序結果主要考慮相關性和其他商業因素,而不區分每條信息對於用戶的需求滿足情況,這會導致相關性好但是用戶需求程度不高的信息展示過多,降低搜索結果的點擊率,買家體驗較差。這種方法產生的排序結果導致賣家點擊率偏低。賣家點擊率等於總點擊量除以總曝光量,當買家的需求類型和信息不匹配的時候,點擊率會降低,從而使得網上交易系統的流量質量不高、點擊率偏低。此外這種方法不能對商品信息加以區分,導致伺服器每次響應用戶通過客戶端發送的查詢請求展現搜索結果時,會不加區分地將用戶需求程度高和用戶需求程度低的所有商品信息混雜在一起傳輸至用戶客戶端,導致網絡中的數據傳輸量巨大,響應速度慢。並且當用戶點擊商品信息時,由於用戶需求程度高和需求程度低的所有商品信息混雜在一起, 導致用戶會點擊大量自己不需要的商品信息,從而使得用戶通過客戶端向伺服器發出大量無用的商品信息的查詢請求,增加了伺服器的工作壓力,進一步影響了伺服器的響應速度。而且,這種方法也不利於市場資源的有效配置。因為,採用這種方法,不同需求程度的商品信息具有大致相同的展現概率,這既讓一部分具有高需求程度的賣家失去了展示信息的機會,又降低了需求程度較低的賣家的點擊率,不利於市場效率的提升。
發明內容
本申請提供一種查詢結果排序方法與裝置,以解決現有技術中流量質量不高、點擊率偏低以及由於對商品信息不加區分地發送給客戶端導致的伺服器工作壓力大的問題。本申請提供了一種查詢結果排序方法,包括接收用戶輸入的查詢詞;搜索到與所述查詢詞對應的商品信息;提取與所述查詢詞對應的商品信息的類目與屬性;根據所獲取的所述商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值;以及根據所獲取的用戶需求值對所述商品信息排序。
本申請還提供了一種查詢結果排序裝置,包括接收模塊,用於接收用戶輸入的查詢詞;搜索模塊,用於搜索到與所述查詢詞對應的商品信息;提取模塊,用於提取與所述查詢詞對應的商品信息的類目與屬性;查找模塊,用於根據所獲取的所述商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;獲取模塊,用於根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值;排序模塊,用於根據所獲取的用戶需求值對所述商品信息排序。本申請提供的查詢結果排序方法及裝置,根據所獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;根據提取出的類目的檔位與權重最高的屬性的個數,獲取與查詢詞對應的商品信息的用戶需求值;根據所獲取的用戶需求值對商品信息排序。由於所獲取的提取出的類目的檔位與權重最高的屬性的個數能夠體現用戶的需求程度,使得計算出的用戶需求值可以反映用戶的需求程度, 這樣,就可以將用戶需求程度高的商品信息優先展示,能夠提高網上交易系統的流量質量, 提高點擊率。並且本申請提供的方法及裝置中,根據用戶需求值的高低對商品信息加以區分, 使得伺服器返回給客戶端的商品信息中,用戶需求值高的商品信息優先顯示,避免用戶點擊大量自己不需要的商品信息,減少用戶通過客戶端向伺服器發送商品信息的查詢請求的數量,從而減輕伺服器的工作壓力,提高伺服器的響應速度。通過以下參照附圖對優選實施例的說明,本申請的上述以及其它目的、特徵和優點將更加明顯。
圖1示例性示出本申請涉及到的一個網上交易處理系統的結構示意圖;圖2示例性示出本申請查詢結果排序方法的流程圖;圖3示例性示出本申請中網上交易系統中線下獲取商品信息的類目的分檔信息與屬性的分檔信息的流程示意圖;圖4示例性示出本申請查詢結果排序裝置的結構示意圖;圖5示例性示出圖4中預處理模塊的結構示意圖;圖6示例性示出圖4中排序模塊的結構示意圖。
具體實施例方式下面將詳細描述本申請的實施例。應當注意,這裡描述的實施例只用於舉例說明, 並不用於限制本申請。本申請首先提出一種用戶需求值的獲取方案,將用戶的點擊行為通過文本的結構化信息進行泛化,換言之,通過被點擊過的商品信息的特徵數據獲取用戶對未被點擊過的商品信息的需求,進而獲得與某一查詢詞對應的所有商品信息的用戶需求值。使用本申請的用戶需求值的獲取方案對商品信息排序,可以有效提升用戶需求值高的商品信息的排序位置,提升搜索的質量,還可以過濾掉用戶需求值低的商品信息甚至垃圾信息,減少數據流量,提高伺服器對用戶的查詢請求的響應速度。本申請還提出一種查詢結果排序方法,其在響應用戶的查詢請求時,使用上述用戶需求值對與查詢詞對應的商品信息進行排序。圖1示例性示出本申請涉及到的一個網上交易處理系統的結構示意圖,該系統包括客戶端1和網上交易系統2,客戶端1的數量可以是多個,各個客戶端1均可以與網上交易系統2進行數據交互。網上交易系統2用於提供商品信息處理,賣家可以通過客戶端1 在網上交易系統2上展示商品,買家可以通過客戶端1從網上交易系統2上購買商品。圖2示例性示出本申請查詢結果排序方法的流程圖,包括步驟101、接收用戶輸入的查詢詞。步驟102、搜索到與查詢詞對應的商品信息。步驟103、提取與查詢詞對應的商品信息的類目與屬性。步驟104、根據所獲取的商品信息的類目的分檔信息與屬性數據的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數。步驟105、根據提取出的類目的檔位與權重最高的屬性的個數,獲取與查詢詞對應的商品信息的用戶需求值。步驟106、根據所獲取的用戶需求值對商品信息排序。本申請提供的查詢結果排序方法,根據所獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;根據提取出的類目的檔位與權重最高的屬性的個數,獲取與查詢詞對應的商品信息的用戶需求值;根據所獲取的用戶需求值對商品信息排序。由於所獲取的提取出的類目的檔位與權重最高的屬性的個數能夠體現用戶的需求程度,使得計算出的用戶需求值可以反映用戶的需求程度,這樣,就可以將用戶需求程度高的商品信息優先展示,能夠提高網上交易系統的流量質量,提高點擊率。並且本申請提供的方法中,根據用戶需求值的高低對商品信息加以區分,使得伺服器返回給客戶端的商品信息中,用戶需求值高的商品信息優先顯示,避免用戶點擊大量自己不需要的商品信息,減少用戶通過客戶端向伺服器發送商品信息的查詢請求的數量, 從而減輕伺服器的工作壓力,提高伺服器的響應速度。上述步驟101-106可以由網上交易系統執行。在步驟101之前還可以包括根據網上交易系統中的商品信息的類目與屬性,獲取商品信息的類目的分檔信息與屬性的分檔信息。網上交易系統獲取商品信息的類目的分檔信息與屬性的分檔信息的步驟可以預先執行,即可以在線下進行,而無需在線上進行,即無需在商品交易時進行。這樣,網上交易系統在接收到查詢詞以後,可以直接根據預先獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數,這樣就無需在商品交易過程中進行商品信息的類目的分檔信息與屬性的分檔信息的獲取的步驟,可以提高商品交易過程中數據處理速度,提升用戶體驗。在本申請的實施例中,商品信息的特徵數據可以包括類目、屬性、產品詞、賣家地域和產品價格中的任一個或任意組合。
根據一個實施例,可以提取類目和屬性作為特徵數據。類目用於描述商品信息的分類。每個商品信息都有相應的分類與之對應。比如關於手機的商品信息放在手機類目下。屬性用於描述商品信息的描述維度,每個商品信息都可以有若干商品信息的描述維度與之對應。比如關於手機的商品信息,可包含品牌、制式、屏幕尺寸等描述維度。在本申請的實施例中之所以選擇類目和屬性作為商品信息的特徵數據,是由於, 點擊率的高低很大程度上取決於商品的分類和描述維度,用這兩個特徵數據更有利於區分點擊數據,並且由於通常每一條商品信息都具有這兩個特徵數據,所以比較容易用這兩個特徵數據進行特徵泛化。比如用戶搜索某一個查詢詞,可以統計出每個類目以及每個屬性對應的點擊率。由於每條商品信息都具有類目和屬性欄位,所以可以計算出每條商品信息的這兩個欄位上的點擊率。在使用類目和屬性作為特徵數據的情況下,根據網上交易系統中的所述商品信息的類目與屬性,獲取商品信息的類目的分檔信息與屬性的分檔信息的步驟,具體可以包括步驟100a、提取網上交易系統中的所有商品信息的類目與屬性。步驟100b、根據網上交易系統中的點擊日誌和曝光日誌,計算查詢詞對應的商品信息的點擊率。步驟100c、將查詢詞對應的商品信息的點擊率作為查詢詞對應的類目的點擊率與屬性的點擊率,根據查詢詞對應的類目的點擊率與屬性的點擊率,將類目與屬性分檔,獲取類目的分檔信息與屬性的分檔信息。在步驟IOOb中已經計算出每個商品信息的點擊率,由於每條商品信息可以表示為類目和屬性集合的形式,在步驟IOOc中,可以將查詢詞對應的商品信息的點擊率作為查詢詞對應的類目的點擊率與屬性的點擊率。例如,某條商品信息的類目是M,具有屬性Ni、 N2……Nn,如果在某次搜索中用戶點擊了該商品信息,就認為該商品信息對應的類目M和屬性m、N2……Nn均獲得到了點擊,如果用戶沒點擊該信息,就認為該商品信息對應類目和屬性未獲得點擊。在本申請的實施例中,上述步驟IOOa與步驟IOOb可以順序執行,也可以由本領域普通技術人員根據實際情況決定,例如,可以同步執行,也可以先執行步驟100b,後執行步驟 100a。步驟IOOb中的查詢詞可以是指網上交易系統過去的一預設時段內接收的用戶輸入的查詢詞。該預設時間段可以根據實際情況確定,例如,可以是一周,也可以是幾個月,等寸。根據一個實施例,步驟IOOb還可以包括根據所述網上交易系統中的點擊日誌和曝光日誌,識別並過濾不能體現用戶需求的數據。其中,曝光日誌記錄有商品信息展示給用戶的次數,點擊日誌記錄有展示給用戶的商品信息被點擊的次數。比如如果通過分析點擊日誌和曝光日誌,發現某次搜索中,曝光的所有商品信息均被點擊,則可以認為該次搜索行為不能反映出用戶的需求,因此,將該次搜索行為設定為無效,點擊日誌和曝光日誌中記錄的與該次搜索行為相關的點擊數據與曝光數據不用於計算查詢詞對應的商品信息的點擊率。步驟IOOc中,根據查詢詞對應的類目的點擊率與屬性的點擊率,將類目與屬性分檔,可以包括根據查詢詞對應的類目的點擊率和/或類目的流量,將類目分檔;以及,根據查詢詞對應的屬性的點擊率和/或屬性的流量,將屬性分檔。經過步驟IOOc後,就可以獲取類目的分檔信息和屬性的分檔信息。類目的分檔信息可以包括各個類目的檔位以及各個檔位對應的具體的類目。如表一所示為本申請的實施例中類目的分檔信息。表一、本申請實施例中類目的分檔信息
類目檔位各個檔位對應的具體的類目1檔類目Al、類目A2、……2檔類目Bi、類目B2、……3檔類目Cl、類目C2、……具體如何分檔,可以參考表二。如表二所示為本申請中類目的檔位的描述信息,該檔位的描述信息用於描述滿足該檔位的標準是什麼。表二、本申請的實施例中類目的檔位的描述信息
類目檔位描述信息1檔為高頁面瀏覽量(Page View,簡稱PV)類目或者中PV 類目,且類目的點擊率大於查詢詞平均類目的點擊率2檔為高PV類目,且類目的點擊率大於查詢詞的平均類目的點擊率的75%;或者,為中PV類目,且類目的點擊率大於查詢詞的平均類目的點擊率的90%3檔為低PV類目;或者, 非1檔和2檔的類目屬性的分檔信息可以包括各個屬性的檔位以及各個檔位對應的具體的屬性。如表三所示,表三所示為本申請的實施例中屬性的分檔信息。表三、本申請的實施例中屬性的分檔信息
屬性檔位各個檔位對應的具體的屬性1檔屬性D1、屬性D2、……0檔屬性E1、屬性E2、…… 具體如何分檔,可以參考表四。如表四所示為本申請中屬性的檔位的描述信息,該檔位的描述信息用於描述滿足該檔位的標準是什麼。
表四、本申請的實施例中屬性的檔位的描述信息
屬性檔位描述信息1檔類目下屬性的點擊率,大於查詢詞的平均屬性的點擊率0檔類目下屬性的點擊率,小於查詢詞的平均的屬性的點擊率表二中,高PV類目是指在一設定的時間內,該類目的流量大於第一閾值。第一閾值可以設置為查詢詞對應所有類目的流量總和的閾值的10%,也可以設置為固定的次數, 例如100次、200次等。設定時間可以是2周,也可以是其他的時間段,可以根據數據處理的實際情況來確定。低PV類目是指在一設定的時間內,該類目的流量低於第二閾值。第二閾值可以設置為查詢詞對應所有類目的流量總和的1%,也可以設置為固定的次數,例如5次。中PV類目是指在一設定的時間內,該類目的流量在第一閾值與第二閾值之間, 即,既非高PV類目,也非低PV類目。表一、表二、表三和表四僅為本申請提供的示例性的表格,本領域普通技術人員應可以根據實際情況進行各種改型或替換。例如,類目的檔位的描述信息中可以只採用查詢詞平均類目的點擊率作為確定檔位的標準,而不採用類目的流量作為確定檔位的標準,或者也可以單獨採用類目的流量作為確定檔位的標準。又例如,在採用查詢詞平均類目的點擊率作為確定類目的檔位的標準時,還可以採用能實現與查詢詞平均類目的點擊率同樣功能的其他數據作為確定類目的檔位的標準。又例如,在採用查詢詞平均類目點擊率作為確定類目的檔位的標準時,還可以採用其他數值,而不限於表二中示出的100^^75%. 90%等等。屬性的檔位的描述信息中可以只採用查詢詞平均屬性的點擊率作為確定檔位的標準, 而不採用屬性的流量作為確定檔位的標準;也可以只採用屬性的流量作為確定檔位的標準,而不採用查詢詞平均屬性的點擊率作為確定檔位的標準;或者也可以採用屬性的流量和查詢詞平均屬性的點擊率作為確定檔位的標準。表一中,1檔是權重最高的檔位,2檔是權重次之的檔位,3檔權重最小;表三中,1 檔是權重最高的檔位,0檔是權重次之的檔位,當然本申請實施例只是示例性的說明,在具體應用中所劃分的檔位可以根據實際情況做調整。如果預先獲取的類目的分檔信息和屬性的分檔信息包括更多個檔位,可以根據實際情況設置各個檔位的權重。根據一個實施例,在步驟104中,可以根據所獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數。例如,對於商品信息的各個類目,可以通過查找表一,確定各個類目的檔位。對於一個商品信息的各個屬性, 可以通過查找表三,確定各個屬性的檔位,並且能夠確定權重最高的屬性的個數。根據一個實施例,在步驟105中,可以將提取出的類目的檔位和權重最高的屬性的個數與用戶偏好權重相結合,計算基於查詢詞的所述搜索結果中各商品信息的用戶需求值。例如,用戶需求值用如下公式(1)表示
9
V = W* α /C1+!* β *VNW (1)上述公式(1)中,V表示用戶需求值,W表示用戶偏好權重,Cl表示類目檔位,Nl 表示權重最高的屬性的個數,Nw表示屬性的總數,α和β可以是預設值,可以取為小於1 並且大於0的數,α和β的和可以等於1。例如,α的取值可以是0.8,β的取值可以是 0.2。W以及α和β的取值可以根據實際情況確定,不限於上述公式中給出的各個數值。 Nw是步驟103中提取出的屬性的總數。根據公式(1)可以獲取各個商品信息的用戶需求值,從而可以根據用戶需求值對各個商品信息進行排序。用戶需求值也可以通過機器學習的方法確定,即對每條商品信息,先人工進行樣本標註,確定每條商品信息的需求程度,然後獲取樣本中商品信息的類目的檔位和屬性的檔位,以此為依據訓練一個用於確定用戶需求值的模型。對於根據當前用戶輸入的查詢詞搜索到的商品信息,可以根據訓練好的模型、該商品信息的類目的檔位和屬性的檔位,預測該商品信息的用戶需求值。根據一個實施例,步驟106可以包括將查詢詞對應的商品信息進行分檔;根據所獲取的用戶需求值調整商品信息在各個檔位內的排序。具體地,可以根據文本相關性對商品信息進行分檔,不同檔位內的商品信息不跨檔。然後,根據用戶需求值調整各個商品信息在各個檔位內的排序。也可以結合市場機制和用戶需求值調整各個商品信息在各個檔位內的排序。在步驟106中,還可以包括過濾用戶需求值低的商品信息,例如通過設置一個閾值,如果計算出的用戶需求值低於該閾值,則過濾掉該用戶需求值對應的商品信息。通過過濾用戶需求值低的商品信息,可以減少反饋給客戶端的數據量,提高對用戶的查詢請求的響應速度。而且,可以避免向用戶展示用戶需求值低的商品信息,提高網上交易系統的流量質量。經過步驟106之後,網上交易系統即可以將經過排序後的商品信息展示給用戶。下面詳細描述本申請在網上交易系統的一種具體的使用方法。圖3示例性示出本申請中網上交易系統中線下獲取商品信息的類目的分檔信息與屬性的分檔信息的流程示意圖,包括步驟201、網上交易系統抽取日誌。日誌可以包括點擊日誌和曝光日誌,曝光日誌記錄有商品信息展示給用戶的次數,點擊日誌記錄有展示給用戶的商品信息被點擊的次數。。網上交易系統從點擊日誌中提取出商品信息在查詢詞下的點擊情況,從曝光日誌提取出商品信息的曝光情況,之後計算出查詢詞對應的商品信息的點擊率(Click Through Rate,簡稱CTR)。點擊率通常用來衡量排序結果的好壞。根據一個實施例,在計算點擊率之前,網上交易系統可以對點擊日誌和曝光日誌中的異常數據進行過濾。比如某次搜索中,如果曝光的所有商品信息均被點擊,則該次搜索行為無效,點擊日誌和曝光日誌中記錄的與該次搜索行為相關的點擊數據與曝光數據將不用於計算查詢詞對應的商品信息的點擊率。這樣,在去除在判斷用戶需求方面無意義或意義較小數據的同時,還可以減少計算點擊率的數據運算量。此外,什麼搜索行為判定為無效是根據該搜索行為是否能體現出用戶需求而定的,因此,本領域普通技術人員應可以推斷出其他過濾無效搜索行的方式,例如,可以通過設置曝光的商品信息被點擊的數目的閾值來確定是否是無效搜索行為,當曝光的商品信息被點擊的數據超過閾值時,認為超過閾值的點擊行為無效。步驟202、網上交易系統抽取數據信息。具體地,網上交易系統可以從描述商品信息的數據中抽取需要的欄位,被抽取的欄位將被作為特徵數據用於用戶需求信息的挖掘。在本申請中,抽取了類目和屬性這兩個特徵數據。步驟203、網上交易系統將步驟201中計算出的商品信息的點擊率作為類目的點擊率和屬性的點擊率。具體地,由於每條商品信息由類目和屬性特徵組成,網上交易系統可以將商品信息的點擊率,作為每個特徵數據的點擊率,即將商品信息的點擊率作為查詢詞對應的類目的點擊率以及每個屬性的點擊率。步驟204、網上交易系統對類目和屬性進行分檔,獲取類目與屬性的分檔信息。具體地,可以根據查詢詞對應的類目的點擊率和/或流量對類目進行分檔,根據查詢詞對應的屬性的點擊率和/或屬性的流量對屬性進行分檔。具體的分檔信息可以參見表一和表
__ ο步驟204中獲取的類目的分檔信息與屬性的分檔信息可以存儲在線下系統中,線下系統可以將類目的分檔信息與屬性的分檔信息生成用戶偏好字典。在本申請的實施例中,上述步驟201與步驟202可以順序執行,也可以由本領域普通技術人員根據實際情況決定,例如,可以同步執行,也可以先執行步驟202,後執行步驟 201。根據一個實施例,除了可以採用類目和屬性作為特徵數據,還可以引入另外的特徵數據。比如,可以將商品標題中產品詞、商品信息中賣家地域、產品價格等作為特徵數據, 這樣,可以更全面的反應買家偏好。當然,本領域普通技術人員可以根據實際情況提取類目、屬性、產品詞、賣家地域、產品價格中的任一個或任意組合,作為商品信息的特徵數據, 還可以採用其他的數據作為商品信息的特徵數據。具體地,網上交易系統接收用戶在線輸入的查詢詞,搜索到與當前輸入的查詢詞對應的關於商品信息。網上交易系統提取出每一條商品信息的類目和屬性,查詢線下系統生成的用戶偏好字典來確定該條商品信息的類目的分檔信息和屬性的分檔信息,基於類目的分檔信息和屬性的分檔信息計算該商品信息的用戶需求值。根據各商品信息的用戶需求值,網上交易系統可以對當前搜索結果的商品信息進行排序,用戶需求值越高的商品信息, 其排序越靠前。由於商品信息通常名單很長,有的長達幾十屏,採用本申請提供的技術方案,滿足用戶需求的商品信息可以排在前面的位置,例如第一屏,使得用戶可以迅速找到滿足其需求的商品信息,提高了買家體驗。並且,由於這種排序結果考慮到了大多數用戶的需求,因此可以提高點擊轉化率, 從而會使網上交易系統的流量質量高,點擊率高。根據一個實施例,在對查詢結果中商品信息進行排序時,還可以結合相關性模型和市場機制模型進行。在這種情況下,排序分為兩部分,首先基於相關性(例如文本相關性)將商品信息進行分檔,不同檔位內的商品信息不會跨檔。然後,通過市場機制模型和基於本申請前述的實施例提供的方法計算出的用戶需求值,將各檔位的商品信息的排序進行調整,例如,可以根據市場機制模型的權重和用戶偏好模型的權重決定商品信息在檔位內的排序情況。根據一個實施例,也可以直接統計每條商品信息的點擊率,依據點擊率對商品信息進行排序。例如,對於某一個查詢詞,點擊率較高的商品信息,排序優於點擊率較低的商品信肩、ο但是採用這種方法,無法實現點擊特徵的泛化,即對於每一個查詢詞,只有具有點擊特徵的商品信息(即被點擊過的商品信息),才可以參與以點擊率為依據的排序。例如在搜索結果的商品信息很多的情況下,只有部分商品信息被點擊,其他商品信息沒有被點擊。 這些沒有被點擊的商品信息不能參與以點擊率為依據的排序。本申請各實施例提供的方法可以用C++實現,可以在Linux系統上運行。圖4示例性示出為本申請查詢結果排序裝置的結構示意圖,該裝置包括接收模塊11、搜索模塊12、提取模塊13、查找模塊14、獲取模塊15和排序模塊16。接收模塊11用於接收用戶輸入的查詢詞。搜索模塊12與接收模塊11連接,用於搜索到與接收模塊11接收到的查詢詞對應的商品信息。提取模塊13與搜索模塊12連接,用於提取與搜索模塊12 搜索到的與查詢詞對應的商品信息的類目與屬性。查找模塊14與提取模塊13連接,用於根據所獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取模塊13提取出的類目的檔位與權重最高的屬性的個數。獲取模塊15與查找模塊14連接,用於根據查找模塊查找出的提取出的類目的檔位與權重最高的屬性的個數,獲取與查詢詞對應的商品信息的用戶需求值。排序模塊16與獲取模塊15連接,用於根據獲取模塊15所獲取的用戶需求值對商品信息排序。如圖4所示的裝置還可以包括預處理模塊17。該預處理模塊17可以與查找模塊 14連接,用於根據網上交易系統中的商品信息的類目與屬性,獲取商品信息的類目的分檔信息與屬性的分檔信息。預處理模塊17獲取的商品信息的類目的分檔信息與屬性的分檔信息,可以提供給查找模塊14。圖5示例性示出圖4中預處理模塊17的結構示意圖。預處理模塊17包括提取單元171、計算單元172和分檔單元173。提取單元171用於提取網上交易系統中的所有商品信息的類目與屬性。計算單元172用於根據網上交易系統中的點擊日誌和曝光日誌,計算查詢詞對應的商品信息的點擊率。分檔單元173與提取單元171和計算單元172連接, 用於將查詢詞對應的商品信息的點擊率作為查詢詞對應的類目的點擊率與屬性的點擊率, 根據查詢詞對應的所述類目的點擊率與屬性的點擊率,將類目與屬性分檔,獲取類目的分檔信息與屬性的分檔信息。圖6示例性示出圖4中排序模塊16的結構示意圖,排序模塊16包括第一排序單元161和第二排序單元162。第一排序單元161用於將查詢詞對應的商品信息進行分檔。 第二排序單元162與第一排序單元161連接,用於根據所獲取的用戶需求值調整商品信息在各個檔位內的排序。第二排序單元162還可以與獲取模塊15連接。其中,第二排序單元162還可以用於在根據所獲取的用戶需求值調整所述商品信息在各個檔位內的排序時,過濾掉用戶需求值低於預設閾值的商品信息。本申請提供的查詢結果排序裝置,查找模塊根據所獲取的商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;獲取模塊根據提取出的類目的檔位與權重最高的屬性的個數,獲取與查詢詞對應的商品信息的用戶需求值;排序模塊根據所獲取的用戶需求值對商品信息排序。由於所獲取的提取出的類目的檔位與權重最高的屬性的個數能夠體現用戶的需求程度,使得計算出的用戶需求值可以反映用戶的需求程度,這樣,就可以將用戶需求程度高的商品信息優先展示,能夠提高網上交易系統的流量質量,提高點擊率。另外,排序模塊中的第二排序單元在根據所獲取的用戶需求值調整所述商品信息在各個檔位內的排序時,過濾掉用戶需求值低於預設閾值的商品信息,這樣,可以減少反饋給客戶端的數據量,提高對用戶的查詢請求的響應速度。而且,可以避免向用戶展示用戶需求值低的商品信息,提高網上交易系統的流量質量。本申請提供的商品信息排序裝置中,各個模塊及單元的具體操作方法可以參照前述方法實施例部分的描述。綜上所述,本申請提供的查詢結果排序方法及裝置具有以下優點之一或任意組合,但不限於這些優點對商品信息根據用戶需求值進行篩選;根據用戶需求值對所述商品信息排序,將用戶需求度高的商品信息排在前面,提高網上交易系統的流量質量、點擊率;過濾掉用戶需求值不高的商品信息,在根據客戶端的查詢請求做出響應時,減少發往客戶端的數據量,提升響應速度。本申請提供的查詢結果排序裝置可以是網上交易系統中的一個設備,例如可以是一個伺服器。本申請提供的查詢結果排序方法可以通過在伺服器上運行程序來實現。雖然已參照典型實施例描述了本申請,但應當理解,所用的術語是說明和示例性、 而非限制性的術語。由於本申請能夠以多種形式具體實施而不脫離發明的精神或實質,所以應當理解,上述實施例不限於任何前述的細節,而應在隨附權利要求所限定的精神和範圍內廣泛地解釋,因此落入權利要求或其等效範圍內的全部變化和改型都應為隨附權利要求所涵蓋。
權利要求
1.一種查詢結果排序方法,用於網上交易系統,其特徵在於,包括接收用戶輸入的查詢詞;搜索到與所述查詢詞對應的商品信息;提取與所述查詢詞對應的商品信息的類目與屬性;根據所獲取的所述商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值;以及根據所獲取的用戶需求值對所述商品信息排序。
2.如權利要求1所述的方法,其特徵在於,在接收用戶輸入的查詢詞之前,還包括根據網上交易系統中的所述商品信息的類目與屬性,獲取所述商品信息的類目的分檔信息與屬性的分檔信息。
3.如權利要求2所述的方法,其特徵在於,根據網上交易系統中的所述商品信息的類目與屬性,獲取所述商品信息的類目的分檔信息與屬性的分檔信息,包括提取所述網上交易系統中的所有所述商品信息的類目與屬性;根據所述網上交易系統中的點擊日誌和曝光日誌,計算所述查詢詞對應的商品信息的點擊率;將所述查詢詞對應的商品信息的點擊率作為所述查詢詞對應的所述類目的點擊率與屬性的點擊率,根據所述查詢詞對應的所述類目的點擊率與屬性的點擊率,將所述類目與屬性分檔,獲取所述類目的分檔信息與屬性的分檔信息。
4.如權利要求3所述的方法,其特徵在於,根據所述查詢詞對應的所述類目的點擊率與屬性的點擊率,將所述類目與屬性分檔,包括根據所述查詢詞對應的所述類目的點擊率和/或所述類目的流量,將所述類目分檔; 以及,根據所述查詢詞對應的所述屬性的點擊率和/或所述屬性的流量,將所述屬性分檔。
5.如權利要求1-4中任一權利要求所述的方法,其特徵在於,根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值,包括將類目的檔位和權重最高的屬性的個數與用戶偏好權重相結合,計算基於所述查詢詞的商品信息的用戶需求值。
6.如權利要求5所述的方法,其特徵在於,根據所獲取的用戶需求值對所述商品信息排序,包括將所述查詢詞對應的商品信息進行分檔;根據所獲取的用戶需求值調整所述商品信息在各個檔位內的排序。
7.如權利要求3所述的方法,其特徵在於,還包括根據所述網上交易系統中的點擊日誌和曝光日誌,識別並過濾不能體現用戶需求的數據。
8.如權利要求1-4中任一權利要求所述的方法,其特徵在於,還包括在根據所獲取的用戶需求值對所述商品信息排序時,過濾掉用戶需求值低於預設閾值的商品信息。
9.一種查詢結果排序裝置,用於網上交易系統,其特徵在於,包括接收模塊,用於接收用戶輸入的查詢詞;搜索模塊,用於搜索到與所述查詢詞對應的商品信息; 提取模塊,用於提取與所述查詢詞對應的商品信息的類目與屬性; 查找模塊,用於根據所獲取的所述商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;獲取模塊,用於根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值;排序模塊,用於根據所獲取的用戶需求值對所述商品信息排序。
10.如權利要求9所述的裝置,其特徵在於,還包括預處理模塊,用於根據網上交易系統中的所述商品信息的類目與屬性,獲取所述商品信息的類目的分檔信息與屬性的分檔信息。
11.如權利要求10所述的裝置,其特徵在於,所述預處理模塊包括提取單元,用於提取所述網上交易系統中的所有所述商品信息的類目與屬性; 計算單元,用於根據所述網上交易系統中的點擊日誌和曝光日誌,計算所述查詢詞對應的商品信息的點擊率;分檔單元,用於將所述查詢詞對應的商品信息的點擊率作為所述查詢詞對應的所述類目的點擊率與屬性的點擊率,根據所述查詢詞對應的所述類目的點擊率與屬性的點擊率, 將所述類目與屬性分檔,獲取所述類目的分檔信息與屬性的分檔信息。
12.如權利要求9-11中任一權利要求所述的裝置,其特徵在於,所述獲取模塊具體用於將類目的檔位和權重最高的屬性的個數與用戶偏好權重相結合,計算基於所述查詢詞的商品信息的用戶需求值。
13.如權利要求9-11中任一權利要求所述的裝置,其特徵在於,所述排序模塊包括 第一排序單元,用於將所述查詢詞對應的商品信息進行分檔;第二排序單元,用於根據所獲取的用戶需求值調整所述商品信息在各個檔位內的排序。
14.如權利要求13所述的裝置,其特徵在於,所述第二排序單元還用於根據所獲取的用戶需求值調整所述商品信息在各個檔位內的排序時,過濾掉用戶需求值低於預設閾值的商品信息。
全文摘要
本申請提供一種查詢結果排序方法及裝置,其中方法包括接收用戶輸入的查詢詞;搜索到與所述查詢詞對應的商品信息;提取與所述查詢詞對應的商品信息的類目與屬性;根據所獲取的所述商品信息的類目的分檔信息與屬性的分檔信息,查找提取出的類目的檔位與權重最高的屬性的個數;根據提取出的類目的檔位與權重最高的屬性的個數,獲取與所述查詢詞對應的商品信息的用戶需求值;以及根據所獲取的用戶需求值對所述商品信息排序。本申請提供的方法及裝置,能夠提高網上交易系統的流量質量,提高點擊率。
文檔編號G06Q30/02GK102542474SQ20101059035
公開日2012年7月4日 申請日期2010年12月7日 優先權日2010年12月7日
發明者馮景華, 陳超 申請人:阿里巴巴集團控股有限公司