新四季網

按業務檢索的方法及系統的製作方法

2023-06-10 23:10:11

專利名稱:按業務檢索的方法及系統的製作方法
技術領域:
本發明涉及信息應用技術領域,更具體地,涉及一種按業務檢索的方法及系統。

背景技術:
信息檢索是電信信息臺需要具備的主要功能。目前,實現信息檢索主要有兩種方法資料庫檢索和搜尋引擎檢索。由於電信信息臺主要進行模糊查詢而不是精確查詢,資料庫檢索的方式很難利用到資料庫的傳統索引,檢索速度會有數量級的下降,而且資料庫查詢缺少詞元(term)匹配和匹配度控制等,所以相比較搜尋引擎檢索更適合在電信信息臺中使用。
電信信息臺的主要業務功能是向用戶準確地提供所要查詢的信息,並且儘可能地把與運營商有籤約關係的企業推薦給用戶,所以用於電信信息臺的搜尋引擎系統與傳統的搜尋引擎系統相比,對查詢的速度和排序有更高的要求 (1)查詢速度要求更高與網頁搜索不同,電信信息臺採用人工話務服務,搜索速度提高1秒,對服務的提高就有很大影響。
(2)查詢結果排序複雜撥打電話到電信信息臺的用戶和信息服務提供商的訴求有時是不同的,用戶想了解他(她)想查詢的信息,而信息服務提供商則希望將籤約的商業信息提供給用戶,所以電信信息臺的話務員根據用戶的要求輸入檢索關鍵詞後,搜尋引擎的返回結果要儘量將籤約的商業信息和與客戶要求最相關的信息排在前面。
另外,不同城市或者不同地區的排序規則經常是不同的,所以搜尋引擎還必須能適應各種不同的業務規則排序。
目前中國的電信行業正處於轉型期,很多新業務正處於探索階段,不同地區的業務經常有較大差異,這必然會導致業務規則的變動。現有的用於電信信息臺的搜索系統,對按業務功能排序的實現是比較有限的,難以滿足不同地區不同業務規則的排序要求。


發明內容
本發明要解決的一個技術問題是提供一種按業務檢索的方法及系統,能夠滿足不同地區不同業務規則的排序要求。
為了實現上述目的,本發明提供了一種按業務檢索的方法,包括通過預先部署的檢索預處理組件對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,並根據業務類型的優先級對多個業務查詢串進行排序;通過預先部署的檢索組件對排序後的多個業務查詢串分別進行檢索;通過預先部署的檢索後處理組件計算輸出結果的排序值,並根據輸出結果的排序值對檢索出的結果進行排序。
根據本發明方法的一個實施例,預先部署檢索預處理組件、檢索組件及檢索後處理組件的操作具體為根據不同地區的業務排序規則從組件庫中選擇檢索預處理組件、檢索組件及檢索後處理組件,配置並級連檢索預處理組件、檢索組件及檢索後處理組件。
根據本發明方法的另一實施例,該方法還包括檢索預處理組件根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間;檢索組件根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果;檢索後處理組件根據輸出結果的排序值對緩存的預分頁後的結果進行排序。
根據本發明方法的又一實施例,分詞查詢串包括查詢關鍵詞及查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
根據本發明方法的再一實施例,通過如下步驟計算輸出結果的排序值在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據分詞查詢串對應的排序值P1(f,w,b)確定輸出結果的排序值P(f,w,b);或在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據業務類型對應的排序值P2(b)確定輸出結果的排序值P(f,w,b);或在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同並且業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定輸出結果的排序值P(f,w,b),其中,業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序;其中,f是查詢關鍵詞分詞後是否有單字的標誌,w是查詢關鍵詞分詞後的關係,b是業務類型。
根據本發明方法的再一實施例,檢索組件根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果的步驟具體為從檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為預分頁後的結果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
為了實現上述目的,本發明還提供了一種按業務檢索的系統,該系統包括預先配置並級連的檢索預處理組件、檢索組件及檢索後處理組件,其中,檢索預處理組件包括分詞模塊、業務分解模塊及業務排序模塊,分詞模塊用於對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,業務分解模塊用於根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,業務排序模塊用於根據業務類型的優先級對多個業務查詢串進行排序;檢索組件包括檢索模塊,檢索模塊用於對排序後的多個業務查詢串分別進行檢索;檢索後處理組件包括排序值計算模塊及結果排序模塊,排序值計算模塊用於計算輸出結果的排序值,結果排序模塊用於根據輸出結果的排序值對檢索出的結果進行排序。
根據本發明系統的一個實施例,檢索預處理組件還包括預分頁區間設置模塊,預分頁區間設置模塊用於根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間;檢索組件還包括預分頁模塊,預分頁模塊用於根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果;結果排序模塊還用於根據輸出結果的排序值對緩存的預分頁後的結果進行排序。
根據本發明系統的另一實施例,分詞查詢串包括查詢關鍵詞及查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
根據本發明系統的又一實施例,排序值計算模塊包括第一判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據分詞查詢串對應的排序值P1(f,w,b)確定輸出結果的排序值P(f,w,b);第二判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據業務類型對應的排序值P2(b)確定輸出結果的排序值P(f,w,b);第三判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同並且業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定輸出結果的排序值P(f,w,b),其中,業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序;其中,f是查詢關鍵詞分詞後是否有單字的標誌,w是查詢關鍵詞分詞後的關係,b是業務類型。
根據本發明系統的再一實施例,預分頁模塊還用於從檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為預分頁後的結果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
本發明提供的按業務檢索的方法及系統,為話務員提供了快速的查詢服務,並且搜索返回的結果能根據預先配置的業務規則進行排序,將最符合用戶要求和最有商業價值的信息排在前面以便話務員選擇。另外,該系統還能夠在統一的框架下根據不同地區配置不同的業務規則,實現不同地區的個性化業務排序功能,適應新業務的發展。



此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分。在附圖中 圖1是本發明採用的Filter-Chain架構示意圖。
圖2是本發明方法的一個實施例的流程示意圖。
圖3是本發明方法的另一實施例的流程示意圖。
圖4是本發明系統的一個實施例的結構示意圖。
圖5是本發明系統的另一實施例的結構示意圖。

具體實施例方式 下面參照附圖對本發明進行更全面的描述,其中說明本發明的示例性實施例。本發明的示例性實施例及其說明用於解釋本發明,但並不構成對本發明的不當限定。
現在的搜尋引擎系統通常是根據相關度進行排序的,但是用於電信信息臺的搜索系統更多是要求按照業務規則進行排序(在業務規則框架中再兼顧相關度的排序),尤其是對全省甚至全國範圍的電信信息臺搜索系統來說,各個地區的業務排序規則很可能是不一樣的甚至是矛盾的,這就很難利用已有搜尋引擎的排序算法來實現。
如圖1所示,是本發明採用的Filter-Chain架構示意圖。該架構實現了檢索的預處理和後處理,並支持級連方式。Filter-Chain架構是一個完整的組成部分,貫穿檢索的全過程,共同實現高性能的查詢和業務排序功能,下面分別介紹各個部分的功能和實現方法。
S101,PreFilter是檢索的預處理,由一組預處理任務組成,組成PreFilter的預處理任務可以根據不同地區的情況分別進行配置,如果需求出現變動,還可以根據接口開發新的預處理任務進行配置。預處理任務的接口可以定義為 public interface PreFilterTask { Listexec(Message msg)throws BtirException; } 其中,Message記錄了客戶查詢串、分頁要求、本次檢索的頁面和頁面大小,例如,查詢第1頁,每頁顯示20條記錄,則Message中的頁面大小是客戶端的每頁顯示記錄數的整數倍,假如客戶端一頁顯示20條記錄,則客戶端向伺服器請求的頁面大小可以是20、40、60......,具體的頁數和頁面大小可以由客戶端確定。
預處理任務的目的是在使用搜尋引擎檢索之前,根據業務規則對待查詢的關鍵詞進行分詞、分詞後的查詢串的分解。可選地還可以進行預分頁條件的設置。
(1)分詞本發明使用現有的分詞算法對查詢關鍵詞進行分詞獲得分詞查詢串,具體規則是 如果查詢關鍵詞分詞後不包括單字,則將查詢關鍵詞分解為「原詞」、「分詞後各單詞的AND關係」以及「分詞後各單詞的OR關係」。例如,客戶查詢關鍵詞為「長城潤滑油」,分詞後的分詞查詢串為「長城潤滑油」、「長城AND潤滑油」以及「長城OR潤滑油」三個查詢串。
如果查詢關鍵詞分詞後包含單字,則分詞後的詞組去掉單字,查詢關鍵詞分解為「原詞」、「分詞後各單詞的AND關係」以及「分詞後各單詞的OR關係」。例如,客戶查詢關鍵詞為「佳億五金維修店」,分詞後的分詞查詢串為「佳億五金維修店」、「五金AND維修」以及「五金OR維修」三個查詢串。
(2)查詢串分解將上述分詞後的查詢串再進行分解是為了實現按業務檢索做準備,根據訂購關鍵字的有關業務(包括直通車、優先報號、品牌推薦、百事通加盟等)將用戶的查詢串分解成多個,並根據業務的優先級從高到低排序。例如,客戶的查詢串為「送水」,查詢串按業務分解後變成四個查詢串「話務轉接送水」、「優先報號送水」、「品牌查詢送水」以及「百事通加盟送水」。
(3)預分頁條件的設置如果在獲得搜尋引擎全部結果集後再進行排序,數據交換量太大(因為要獲得數據結果集的全部記錄,數據加載的時間消耗會很大),這必然導致查詢速度的下降,對查詢性能非常敏感的系統是不能接受的,預分頁的目標是查詢時只返回部分數據進行排序。例如,可以通過如下方式實現當要求查詢第i頁的記錄,每頁顯示的條目數為p時,預分頁設置一個緩存參數k(根據測試情況和經驗進行配置,一般取3-5),預分頁後搜尋引擎返回的查詢結果是max(0,(i-k)*p)到max(0,(i-k)*p)+(i+k)*p之間的記錄。
S102,客戶的原始查詢關鍵詞通過PreFilter分解後開始進行檢索。檢索過程由一組檢索任務組成,與預處理任務類似,檢索任務也可以根據地區進行靈活的配置,檢索任務的接口是 public interface SearchTask { void doQuery(StructuredQuery sq,InformList list)throws BtirException; } 檢索任務根據PreFilter分解後的查詢串進行檢索,並實現結果集的去重與合併。
(1)檢索將PreFilter分解後的查詢串轉換成lucene(lucene是基於Java的全文索引工具包)語法格式,採用lucene進行多次檢索,獲得結果集但不取出以避免大的輸入和輸出。
(2)構造結果集根據PreFilter設置的預分頁條件,將檢索結果去重與合併後再取出部分記錄。
S103,PostFilter是檢索的後處理,由一組後處理任務組成。與前面的PreFilter和Search類似,PostFilter可以根據地區對後處理任務進行靈活地配置。後處理任務的接口是 public interface PostFilterTask { Object exec(int len,Object[]objs)throws BtirException; } PostFilter主要實現和業務相關的排序權重。可選地,基於PreFilter中設置的預分頁條件可以進行分頁處理。
(1)業務排序根據每種業務的排序策略和業務之間的權重關係,重新計算每條查詢結果的綜合值,再根據綜合值進行排序。例如,可以根據下述函數計算一條記錄的綜合值P(f,w,b)=[P1(f,w,b),P2(b),s(b)]。
其中,P1(f,w,b)是一個三輸入參數的函數,根據業務規則配置每種業務在不同分詞情況下的權重值;f是查詢關鍵詞分詞後是否有單字的標誌;w是分詞後的關係,取值有3個「原詞」、「分詞後各單詞的AND關係」以及「分詞後各單詞的OR關係」;P2(b)是排序相關的業務,取值有5個話務呼轉、優先報號、品牌推薦、百事通加盟、語音名片;s(b)是根據業務規定的業務排序規則計算的分值,至少有以下幾種計算方法 輪循或按比例播報sendNum/privalue,sendNum是記錄的播報次數,privalue是信息的權重; 隨機輪循s(b)等於一個0-1之間的隨機值; 按天輪循Floor([d-Floor(d/n)*n]/p)*n+p,其中p是每個記錄的信息權重,d是合同開始天數,n是購買同一產品的記錄總數; 固定排序直接取信息的權重值privalue; 直接取搜尋引擎排序的score值。
(2)分頁根據客戶原始請求的頁面信息返回相應的查詢結果。
上述Filter-Chain的搜尋引擎系統架構用於構建類似支持號碼百事通業務的電信信息臺,特別能滿足系統對查詢速度和對搜索結果進行複雜業務排序的要求。該系統實現了可方便擴展的排序規則配置和接口,適應業務靈活變化的情況,能快速支持新業務的推出。在統一的框架下實現了不同地區的個性化排序策略。同時該系統還充分考慮了搜尋引擎排序的性能,完全滿足電信信息臺實時查詢的需求。
如圖2所示,是本發明方法的一個實施例的流程示意圖。該實施例可以包括以下步驟 S201,通過預先部署的檢索預處理組件對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,並根據業務類型的優先級對多個業務查詢串進行排序; S202,通過預先部署的檢索組件對排序後的多個業務查詢串分別進行檢索; S203,通過預先部署的檢索後處理組件計算輸出結果的排序值,並根據輸出結果的排序值對檢索出的結果進行排序。
其中,預先部署檢索預處理組件、檢索組件及檢索後處理組件的操作具體為根據不同地區的業務排序規則從組件庫中選擇檢索預處理組件、檢索組件及檢索後處理組件,配置並級連檢索預處理組件、檢索組件及檢索後處理組件。
具體地,如果輸出結果的排序值為P(f,w,b)=[P1(f,w,b),P2(b),s(b)],則可以通過如下步驟計算輸出結果的排序值在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據分詞查詢串對應的排序值P1(f,w,b)確定輸出結果的排序值P(f,w,b);或在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據業務類型對應的排序值P2(b)確定輸出結果的排序值P(f,w,b);或在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同並且業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定輸出結果的排序值P(f,w,b),其中,業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序。
其中,f是查詢關鍵詞分詞後是否有單字的標誌,w是查詢關鍵詞分詞後的關係,b是業務類型,各個城市可以靈活地配置P1(f,w,b)、P2(b)和s(b)。
對於參數w,如果分詞後無單字,例如,「體育器材」,分詞後的結果是「體育」和「器材」,則分詞順序w是「體育器材」、「體育AND器材」、「體育OR器材」;如果分詞後有單字,例如,「佳藝五金維修」,分詞後的結果是「佳」、「藝」、「五金」和「維修」,則去掉單字後的結果是「五金」和「維修」,分詞順序w是「佳藝五金維修」、「五金AND維修」、「五金OR維修」。
在排序的時候,先比較P1(f,w,b)的大小,如果P1(f,w,b)相等再比較P2(b),如果P2(b)相等再比較s(b)的大小。
下述表1是P1(f,w,b)的含義

表1 下述表2是P2(b)的含義 表2 s(b)是根據業務規定的業務排序規則計算的分值,有以下5種取值按比例播報、隨機輪循、按天輪循、固定排序、相關度排序。
例如,假設系統配置的業務類型包括話務呼轉、優先報號、品牌推薦、百事通加盟、語音名片及其他,客戶待查詢的關鍵詞為「佳億五金維修店」,則系統按下述順序返回查詢結果 (1)訂購關鍵字包括原詞「佳億五金維修店」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (2)訂購關鍵字包括原詞「佳億五金維修店」的優先報號記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (3)訂購關鍵字包括原詞「佳億五金維修店」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (4)業務說明中包括原詞「佳億五金維修店」的百事通加盟記錄,記錄之間隨機輪循; (5)企業名稱中包括原詞「佳億五金維修店」的語音名片記錄,記錄之間根據相關度排序; (6)企業名稱中包括原詞「佳億五金維修店」的其它記錄,記錄之間根據相關度排序; (7)訂購關鍵字包括「五金」AND「維修」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (8)訂購關鍵字包括「五金」AND「維修」的優先報號,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (9)訂購關鍵字包括「五金」AND「維修」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (10)業務說明中包括「五金」AND「維修」的百事通加盟記錄,記錄之間隨機輪循; (11)企業名稱中包括「五金」AND「維修」的語音名片記錄,記錄之間根據相關度排序; (12)企業名稱中包括「五金」AND「維修」的其它記錄,記錄之間根據相關度排序; (13)訂購關鍵字包括「五金」OR「維修」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (14)訂購關鍵字包括「五金」OR「維修」的優先報號記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (15)訂購關鍵字包括「五金」OR「維修」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (16)業務說明中包括「五金」OR「維修」的百事通加盟記錄,記錄之間隨機輪循『 (17)企業名稱中包括「五金」OR「維修」的語音名片記錄,記錄之間根據相關度排序; (18)企業名稱中包括「五金」OR「維修」的其它記錄,記錄之間根據相關度排序。
該實施例能夠根據預先配置的業務規則進行排序,將最符合用戶要求和最有商業價值的信息排在前面以便話務員選擇。另外,該實施例還能為不同地區配置不同的業務規則,實現不同地區的個性化業務排序功能,適應新業務的發展。
如圖3所示,是本發明方法的另一實施例的流程示意圖。該實施例包括以下步驟 S301,通過預先部署的檢索預處理組件對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,並根據業務類型的優先級對多個業務查詢串進行排序。
S302,檢索預處理組件根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間。
S303,通過預先部署的檢索組件對排序後的多個業務查詢串分別進行檢索。
S304,檢索組件根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果; 其中,檢索組件根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果的步驟可以具體為從檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為預分頁後的結果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
例如,假設客戶要檢索第1頁,每頁顯示20條記錄,檢索預處理組件設置預分頁條件的時候(假設k=3)要求搜尋引擎返回0(根據max(0,(1-3)*20)=0計算得到)到80(根據(1+3)*20=80計算得到)的記錄,檢索組件檢索後從結果集中取出第0到第80條記錄,檢索後處理組件根據業務規則排序後,取出0到20條記錄返回給調用者。
再例如,假設客戶端要檢索第4頁,每頁顯示20條記錄,檢索預處理組件設置預分頁條件的時候(假設k=3)要求搜尋引擎返回20(根據max(0,(4-3)*20)=20計算得到)到140(根據(4+3)*20=140計算得到)的記錄,檢索組件檢索後從結果集中取出第20到第140條記錄,檢索後處理組件根據業務規則排序後,取出80到120條記錄返回給調用者。
進一步地,檢索預處理組件將一個查詢關鍵詞根據業務規則分解成多個查詢串,例如,查詢關鍵詞「體育器材」被檢索預處理組件分解成18個查詢串(如下所示),並且檢索預處理組件設置預分頁時要求搜尋引擎返回20至140條之間的記錄。檢索組件對這18個查詢條件依次進行檢索,當前面n個查詢條件檢索出的記錄總數大於等於140後,就停止檢索,取其中第20條至140條之間的記錄返回。
查詢關鍵詞「體育器材」被檢索預處理組件分解成的18個查詢串如下所示 (1)訂購關鍵字包括原詞「體育器材」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (2)訂購關鍵字包括原詞「體育器材」的優先報號記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (3)訂購關鍵字包括原詞「體育器材」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (4)訂購關鍵字包括「體育」AND「器材」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (5)訂購關鍵字包括「體育」AND「器材」的優先報號,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (6)訂購關鍵字包括「體育」AND「器材」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (7)業務說明中包括原詞「體育器材」的百事通加盟記錄,記錄之間隨機輪循; (8)業務說明中包括「體育」AND「器材」的百事通加盟記錄,記錄之間隨機輪循; (9)企業名稱中包括原詞「體育器材」的語音名片記錄,記錄之間根據相關度排序; (10)企業名稱中包括「體育」AND「器材」的語音名片記錄,記錄之間根據相關度排序; (11)企業名稱中包括原詞「體育器材」的其它記錄,記錄之間根據相關度排序; (12)企業名稱中包括「體育」AND「器材」的其它記錄,記錄之間根據相關度排序; (13)訂購關鍵字包括「體育」OR「器材」的話務呼轉記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (14)訂購關鍵字包括「體育」OR「器材」的優先報號記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (15)訂購關鍵字包括「體育」OR「器材」的品牌推薦記錄,其中訂購同一個關鍵字的記錄根據播報次數按比例輪循; (16)業務說明中包括「體育」OR「器材」的百事通加盟記錄,記錄之間隨機輪循; (17)企業名稱中包括「體育」OR「器材」的語音名片記錄,記錄之間根據相關度排序; (18)企業名稱中包括「體育」OR「器材」的其它記錄,記錄之間根據相關度排序。
S305,通過預先部署的檢索後處理組件計算輸出結果的排序值,並根據輸出結果的排序值對緩存的預分頁後的結果進行排序。
在上述實施例中,分詞查詢串包括查詢關鍵詞及查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
採用預分頁方法是有前提條件的,根據搜尋引擎檢索出排在第n位的記錄(搜尋引擎是根據相關度檢索的),根據業務規則排序的範圍應該在[n-C,n+C]的範圍內(C是一個常數)。即,業務規則排序是和相關度排序有一定關聯性。如果不能滿足這個條件,就不宜採用預分頁方法。例如,根據「體育器材」檢索到的符合百事通加盟業務的記錄數有200條,記錄A在搜尋引擎檢索出的順序中排第160位,檢索組件只取前面20-140條記錄給檢索後處理組件進行排序,A就不在排序範圍之內,但是根據業務規則,A是應該排在前面的,這時排序的結果就不準確了。
但是,在電信信息臺的應用中採用預分頁方法是合適的,因為從業務規則的制定上看,一個關鍵字銷售給商家的數量必然是有限的,否則商家購買關鍵字就失去了意義,所以檢索預處理組件的參數k設置足夠大,肯定能將訂購了關鍵字的記錄全部取出來,預分頁參數k是排序準確性和排序效率的一個權衡值。
如果要做到預分頁的情況下仍然滿足業務排序規則的準確性,可以用更複雜的技術,但是沒有太大的實用價值。本發明提出的預分頁方法,在排序的性能和效果上已經可以達到很好的平衡。
如圖4所示,是本發明系統的一個實施例的結構示意圖。該實施例可以包括預先配置並級連的檢索預處理組件11、檢索組件12及檢索後處理組件13,其中,檢索預處理組件11包括分詞模塊111、業務分解模塊112及業務排序模塊113,分詞模塊111用於對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,業務分解模塊112用於根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,業務排序模塊113用於根據業務類型的優先級對多個業務查詢串進行排序;檢索組件12包括檢索模塊121,檢索模塊121用於對排序後的多個業務查詢串分別進行檢索;檢索後處理組件13包括排序值計算模塊131及結果排序模塊132,排序值計算模塊131用於計算輸出結果的排序值,結果排序模塊132用於根據輸出結果的排序值對檢索出的結果進行排序。
該實施例能夠根據預先配置的業務規則進行排序,將最符合用戶要求和最有商業價值的信息排在前面以便話務員選擇。另外,該實施例還能為不同地區配置不同的業務規則,實現不同地區的個性化業務排序功能,適應新業務的發展。
如圖5所示,是本發明系統的另一實施例的結構示意圖。與圖4中的實施例相比,該實施例中的檢索預處理組件21還包括預分頁區間設置模塊211,預分頁區間設置模塊211用於根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間;檢索組件22還包括預分頁模塊221,預分頁模塊221用於根據預分頁區間對檢索出的結果進行預分頁,並緩存預分頁後的結果;結果排序模塊132還用於根據輸出結果的排序值對緩存的預分頁後的結果進行排序。
根據本發明系統的又一實施例,預分頁模塊221還用於從檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為預分頁後的結果;其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
上述兩個實施例進行預分頁處理後可以減少取記錄的輸入和輸出,提高了排序的速度。
在本發明系統的再一實施例中,與圖4中的實施例相比,該實施例中的排序值計算模塊可以包括第一判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據分詞查詢串對應的排序值P1(f,w,b)確定輸出結果的排序值P(f,w,b);第二判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據業務類型對應的排序值P2(b)確定輸出結果的排序值P(f,w,b);第三判斷單元,用於在不同業務類型下的分詞查詢串對應的排序值P1(f,w,b)相同並且業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定輸出結果的排序值P(f,w,b),其中,業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序;其中,f是查詢關鍵詞分詞後是否有單字的標誌,w是查詢關鍵詞分詞後的關係,b是業務類型。
在上述實施例中,分詞查詢串包括查詢關鍵詞及查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
該實施例為話務員提供了快速的查詢服務,並且搜索返回的結果能根據預先配置的業務規則進行排序,將最符合用戶要求和最有商業價值的信息排在前面以便話務員選擇。
本發明的描述是為了示例和描述起見而給出的,而並不是無遺漏的或者將本發明限於所公開的形式。很多修改和變化對於本領域的普通技術人員而言是顯而易見的。選擇和描述實施例是為了更好說明本發明的原理和實際應用,並且使本領域的普通技術人員能夠理解本發明從而設計適於特定用途的帶有各種修改的各種實施例。
權利要求
1.一種按業務檢索的方法,其特徵在於,所述方法包括
通過預先部署的檢索預處理組件對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,根據業務類型對所述分詞查詢串進行分解獲得基於所述分詞查詢串的多個業務查詢串,並根據所述業務類型的優先級對所述多個業務查詢串進行排序;
通過預先部署的檢索組件對所述排序後的多個業務查詢串分別進行檢索;
通過預先部署的檢索後處理組件計算輸出結果的排序值,並根據所述輸出結果的排序值對檢索出的結果進行排序。
2.根據權利要求1所述的方法,其特徵在於,預先部署所述檢索預處理組件、所述檢索組件及所述檢索後處理組件的操作具體為
根據不同地區的業務排序規則從組件庫中選擇所述檢索預處理組件、所述檢索組件及所述檢索後處理組件,配置並級連所述檢索預處理組件、所述檢索組件及所述檢索後處理組件。
3.根據權利要求1所述的方法,其特徵在於,所述方法還包括
所述檢索預處理組件根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間;
所述檢索組件根據所述預分頁區間對所述檢索出的結果進行預分頁,並緩存預分頁後的結果;
所述檢索後處理組件根據所述輸出結果的排序值對緩存的所述預分頁後的結果進行排序。
4.根據權利要求1所述的方法,其特徵在於,
所述分詞查詢串包括所述查詢關鍵詞及所述查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
5.根據權利要求1所述的方法,其特徵在於,通過如下步驟計算所述輸出結果的排序值
在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據所述分詞查詢串對應的排序值P1(f,w,b)確定所述輸出結果的排序值P(f,w,b);或
在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據所述業務類型對應的排序值P2(b)確定所述輸出結果的排序值P(f,w,b);或
在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)相同並且所述業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定所述輸出結果的排序值P(f,w,b),其中,所述業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序;
其中,f是所述查詢關鍵詞分詞後是否有單字的標誌,w是所述查詢關鍵詞分詞後的關係,b是所述業務類型。
6.根據權利要求3所述的方法,其特徵在於,所述檢索組件根據所述預分頁區間對所述檢索出的結果進行預分頁,並緩存預分頁後的結果的步驟具體為
從所述檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為所述預分頁後的結果;
其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為所述期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
7.一種按業務檢索的系統,其特徵在於,所述系統包括預先配置並級連的檢索預處理組件、檢索組件及檢索後處理組件,其中,
所述檢索預處理組件包括分詞模塊、業務分解模塊及業務排序模塊,所述分詞模塊用於對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,所述業務分解模塊用於根據業務類型對所述分詞查詢串進行分解獲得基於所述分詞查詢串的多個業務查詢串,所述業務排序模塊用於根據所述業務類型的優先級對所述多個業務查詢串進行排序;
所述檢索組件包括檢索模塊,所述檢索模塊用於對所述排序後的多個業務查詢串分別進行檢索;
所述檢索後處理組件包括排序值計算模塊及結果排序模塊,所述排序值計算模塊用於計算輸出結果的排序值,所述結果排序模塊用於根據所述輸出結果的排序值對檢索出的結果進行排序。
8.根據權利要求7所述的系統,其特徵在於,
所述檢索預處理組件還包括預分頁區間設置模塊,所述預分頁區間設置模塊用於根據期望輸出的頁號和每頁顯示的條目數設置預分頁區間;
所述檢索組件還包括預分頁模塊,所述預分頁模塊用於根據所述預分頁區間對所述檢索出的結果進行預分頁,並緩存預分頁後的結果;
所述結果排序模塊還用於根據所述輸出結果的排序值對緩存的所述預分頁後的結果進行排序。
9.根據權利要求7所述的系統,其特徵在於,
所述分詞查詢串包括所述查詢關鍵詞及所述查詢關鍵詞分詞後的各單詞的「邏輯與」和/或「邏輯或」關係。
10.根據權利要求7所述的系統,其特徵在於,所述排序值計算模塊包括
第一判斷單元,用於在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)不相同的情況下,根據所述分詞查詢串對應的排序值P1(f,w,b)確定所述輸出結果的排序值P(f,w,b);
第二判斷單元,用於在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)相同的情況下,根據所述業務類型對應的排序值P2(b)確定所述輸出結果的排序值P(f,w,b);
第三判斷單元,用於在不同業務類型下的所述分詞查詢串對應的排序值P1(f,w,b)相同並且所述業務類型對應的排序值P2(b)相同的情況下,根據業務排序規則對應的排序值s(b)確定所述輸出結果的排序值P(f,w,b),其中,所述業務排序規則包括按比例播報、隨機輪循、按天輪循、固定排序及相關度排序;
其中,f是所述查詢關鍵詞分詞後是否有單字的標誌,w是所述查詢關鍵詞分詞後的關係,b是所述業務類型。
11.根據權利要求8所述的系統,其特徵在於,所述預分頁模塊還用於從所述檢索出的結果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區間中的結果作為所述預分頁後的結果;
其中,max((i-k)*p,0)為緩存的起始條目編號,max((i-k)*p,0)+(i+k)*p為緩存的結束條目編號,i為所述期望輸出的頁號,k為緩存係數,p為每頁顯示的條目數。
全文摘要
本發明公開了一種按業務檢索的方法及系統。其中,該方法包括通過預先部署的檢索預處理組件對輸入的查詢關鍵詞進行分詞獲得分詞查詢串,根據業務類型對分詞查詢串進行分解獲得基於分詞查詢串的多個業務查詢串,並根據業務類型的優先級對多個業務查詢串進行排序;通過預先部署的檢索組件對排序後的多個業務查詢串分別進行檢索;通過預先部署的檢索後處理組件計算輸出結果的排序值,並根據輸出結果的排序值對檢索出的結果進行排序。本發明的方法及系統,能夠在統一的框架下根據不同地區配置不同的排序規則,實現多個地區的個性化業務排序功能,適應新業務的發展。
文檔編號G06F17/30GK101699440SQ20091022359
公開日2010年4月28日 申請日期2009年11月24日 優先權日2009年11月24日
發明者梁冰, 蔡堅錚, 張玉忠, 林全疆, 方艾, 宋平波, 李雲, 金鐸, 趙華, 陳康 申請人:中國電信股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀