新四季網

搜索需求分析方法和裝置製造方法

2023-09-24 03:07:45

搜索需求分析方法和裝置製造方法
【專利摘要】本發明提出一種搜索需求分析方法和裝置,其中,該搜索需求分析方法包括以下步驟:獲取搜索詞,並獲取搜索詞對應的多個關聯詞;抽取搜索詞的特徵並作為原始特徵,並抽取多個關聯詞的特徵並作為關聯特徵;以及根據原始特徵和關聯特徵獲取搜索需求。本發明的搜索需求分析方法,能夠準確地獲取用戶的搜索需求,從而搜尋引擎根據用戶的搜索需求提供更符合用戶需要的搜索結果,進而在提高了搜索的準確率的同時,還提高了搜索的召回率。此外,搜索需求的分析過程與語言無關,因此可方便地在多個不同語種之間進行遷移,更加方便。
【專利說明】搜索需求分析方法和裝置

【技術領域】
[0001] 本發明涉及搜索【技術領域】,特別涉及一種搜索需求分析方法和裝置。

【背景技術】
[0002] 傳統的關鍵詞匹配搜尋引擎,由於只是對搜索詞query進行分詞,利用得到的關 鍵詞到索引數據中進行檢索,並不真正完全理解用戶的檢索意圖,導致檢索出的結果僅是 包含搜索詞中的關鍵詞的結果,並不一定能夠滿足用戶的檢索需求。例如Query"劉德華的 圖片",在傳統的搜尋引擎中將分別用"劉德華"和"圖片"兩個關鍵詞在索引數據中進行檢 索,檢索結果只是包含關鍵詞"劉德華"或者包含關鍵詞"圖片"的數據,而非用戶真正想獲 得的"劉德華圖片"的數據資源。
[0003] 因此可進行搜索需求分析的搜尋引擎,在現代搜尋引擎中扮演著越來越重要的作 用。搜索需求分析即分析搜索詞的結構與成分,從語義上理解搜索詞的檢索需求,從而識別 出用戶的檢索意圖,從語義上理解query的檢索需求,除了能夠提供更精準的檢索結果之 夕卜,還能夠針對用戶的檢索需求,提供更靈活的產品形態。例如Query "劉德華的圖片"進 行需求識別之後,可以直接提供用戶需要的劉德華圖片資源。
[0004] 搜索需求分析目前大多採用模板匹配或者利用Query的檢索結果訓練機器學習 模型的方法。其中模板匹配雖然準確率很高,但是檢索結果不夠全面,召回率很低,並且模 板挖掘依賴於大量人力工作,需要針對每一類需求進行模板挖掘,工作量大,而且語種之間 無法遷移;而利用Query檢索結果訓練機器學習模型的方法完全依賴於檢索結果的準確 性,準確率很難獲得保證,從而導致根據訓練的及其學習模型進行搜索得到的結果的準確 率也無法保證。


【發明內容】

[0005] 本發明旨在至少在一定程度上解決上述技術問題。
[0006] 為此,本發明的第一個目的在於提出一種搜索需求分析方法,在提高了搜索的準 確率的同時,還提高了搜索的召回率,可方便地在多個不同語種之間進行遷移,更加方便。
[0007] 本發明的第二個目的在於提出一種搜索需求分析裝置。
[0008] 為達上述目的,根據本發明第一方面實施例提出了一種搜索需求分析方法,包括 以下步驟:獲取搜索詞,並獲取所述搜索詞對應的多個關聯詞;抽取所述搜索詞的特徵並 作為原始特徵,並抽取所述多個關聯詞的特徵並作為關聯特徵;以及根據所述原始特徵和 所述關聯特徵獲取搜索需求。
[0009] 本發明實施例的搜索需求分析方法,通過獲取搜索詞對應的多個關聯詞,並分別 抽取搜索詞的特徵和多個關聯詞的特徵,根據搜索詞的特徵和關聯詞的特徵獲取搜索需 求,能夠準確地獲取用戶的搜索需求,從而搜尋引擎根據用戶的搜索需求提供更符合用戶 需要的搜索結果,進而在提高了搜索的準確率的同時,還提高了搜索的召回率。此外,搜索 需求的分析過程與語言無關,因此可方便地在多個不同語種之間進行遷移,更加方便。
[0010] 本發明第二方面實施例提供了一種搜索需求分析裝置,包括:第一獲取模塊,用於 獲取搜索詞,並獲取所述搜索詞對應的多個關聯詞;抽取模塊,用於抽取所述搜索詞的特徵 並作為原始特徵,並抽取所述多個關聯詞的特徵並作為關聯特徵;以及第二獲取模塊,用於 根據所述原始特徵和所述關聯特徵獲取搜索需求。
[0011] 本發明實施例的搜索需求分析裝置,通過獲取搜索詞對應的多個關聯詞,並分別 抽取搜索詞的特徵和多個關聯詞的特徵,根據搜索詞的特徵和關聯詞的特徵獲取搜索需 求,能夠準確地獲取用戶的搜索需求,從而搜尋引擎根據用戶的搜索需求提供更符合用戶 需要的搜索結果,進而在提高了搜索的準確率的同時,還提高了搜索的召回率。此外,搜索 需求的分析過程與語言無關,因此可方便地在多個不同語種之間進行遷移,更加方便。
[0012] 本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發明的實踐了解到。

【專利附圖】

【附圖說明】
[0013] 本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變 得明顯和容易理解,其中 :
[0014] 圖1為根據本發明一個實施例的搜索需求分析方法的流程圖;
[0015] 圖2為根據本發明一個實施例的抽取搜索詞的特徵並作為原始特徵的流程圖;
[0016] 圖3a為根據本發明實施例的中文的搜索結果示意圖;
[0017] 圖3b為根據本發明實施例的葡萄牙語的搜索結果示意圖;
[0018] 圖3c為根據本發明實施例的阿拉伯語的搜索結果示意圖;
[0019] 圖4為根據本發明一個實施例的搜索需求分析裝置的結構示意圖;
[0020] 圖5為根據本發明一個具體實施例的搜索需求分析裝置的結構示意圖。

【具體實施方式】
[0021] 下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用於解釋本發明,而不能理解為對本發明的限制。
[0022] 在本發明的描述中,需要理解的是,術語"多個"指兩個或兩個以上;術語"第一"、 "第二"僅用於描述目的,而不能理解為指示或暗示相對重要性。
[0023] 下面參考附圖描述根據本發明實施例的搜索需求分析方法和裝置。
[0024] 為了提高搜索需求分析中搜索結果的準確率和召回率,本發明提出了一種搜索需 求分析方法,包括以下步驟:獲取搜索詞,並獲取搜索詞對應的多個關聯詞;抽取搜索詞的 特徵並作為原始特徵,並抽取多個關聯詞的特徵並作為關聯特徵;以及根據原始特徵和關 聯特徵獲取搜索需求。
[0025] 圖1為根據本發明一個實施例的搜索需求分析方法的流程圖。如圖1所示,根據 本發明實施例的搜索需求分析方法,包括:
[0026] S101,獲取搜索詞,並獲取搜索詞對應的多個關聯詞。
[0027] 其中,搜索詞為用戶進行搜索時輸入的,可以是一個詞語或者多個詞語的組合。關 聯詞是與搜索詞字面相近或者語義相近的詞語。舉例來說,對於搜索詞"劉德華的圖片",對 應的關聯詞可為"劉德華頭像"、"劉德華圖片版"、"劉德華寫真"、"精選華仔圖片"和"劉德 華壁紙"等。
[0028] 具體地,在本發明的實施例中,獲取搜索詞對應的多個關聯詞具體包括:
[0029] 以搜索詞為中心將與搜索詞之間的編輯距離小於預設距離的詞作為關聯詞;和/ 或對搜索詞進行語義分析,並將與搜索詞語義近似的詞作為關聯詞。
[0030] 其中,編輯距離是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數, 可用於表示詞串之間的相似度。因此,可通過編輯距離從搜索詞的組成結構上挖掘出與搜 索詞字面相關聯的關聯詞。
[0031] 通過對搜索詞進行語義分析,可從語義上挖掘出與搜索詞相關聯的關聯詞。
[0032] 此外,為了能夠全面地獲取搜索詞對應的關聯詞,可同時從字面以及語義兩方面 挖掘搜索詞的關聯詞。
[0033] S102,抽取搜索詞的特徵並作為原始特徵,並抽取多個關聯詞的特徵並作為關聯 特徵。
[0034] 在本發明的實施例中,抽取搜索詞的特徵並作為原始特徵可通過如圖2所示的方 法實現,具體地,如圖2所示,抽取搜索詞的特徵並作為原始特徵,包括:
[0035] S201,提取搜索詞中的專名、專名類別以及各個成分的語義TAG信息。
[0036] 其中,專名是用於指稱實體的詞或詞組,舉例來說,可以分為人名、地名、朝代名、 種族名、國名、機構名等不同的專名類別。
[0037] 語義TAG信息為搜索詞中各個成分的語義標籤。舉例來說對於搜索詞中的一個成 分"劉德華"的語義標籤可以是"電影演員"、"歌手"、"港臺明星"、"華仔"等。
[0038] S202,提取搜索詞的組成結構。
[0039] S203,根據搜索詞中的專名、專名類別、各個成分的語義TAG信息以及組成結構生 成搜索詞的描述模板,並將描述模板作為原始特徵。
[0040] 在本發明的實施例中,一方面可通過對關聯詞本身進行分析以抽取搜索詞的特 徵。具體地,可對關聯詞進行分詞以抽取與搜索詞相關且不包含搜索詞的多個關鍵詞,然 後,從多個關鍵詞中選擇與搜索詞需求相關的特徵詞,並將特徵詞作為多個關聯詞的特徵。 舉例來說,如果對關聯詞進行分詞後得到一個不包含搜索詞的關鍵詞有"壁紙"、"寫真"、 "精選"等,則可得到與搜索詞需求相關的特徵詞"壁紙"和"寫真",並作為關聯特徵。
[0041] 另一方面,還可通過對根據關聯詞獲取的搜索結果或通過對用戶點擊日誌進行分 析以抽取搜索詞的特徵。具體地,可獲取多個關聯詞的多個搜索結果或用戶點擊日誌,然 後,從多個關聯詞的多個搜索結果或用戶點擊日誌中抽取關聯詞的Title特徵、搜索特徵 和點擊特徵中的一種或多種,並將Title特徵、搜索特徵和點擊特徵中的一種或多種作為 關聯特徵。
[0042] S103,根據原始特徵和關聯特徵獲取搜索需求。
[0043] 在本發明的一個實施例中,具體地,可根據原始特徵和關聯特徵查詢搜索需求識 別模型以獲取搜索需求。
[0044] 從而,搜尋引擎可根據得到的搜索需求獲取更符合用戶需要的結果。因此,更能符 合用戶需求,提高了搜索的準確率更高,另外,能夠比較全面地獲取與搜索詞相關的搜索結 果,提高了搜索的召回率。
[0045] 具體地,搜索效果可如圖3所示,圖3a、圖3b和圖3c分別為根據本發明實施例的 中文、葡萄牙語、阿拉伯語的搜索結果示意圖。
[0046] 如圖3a所示,對於搜索詞"劉德華的圖片",搜索結果主要是關於劉德華的圖片類 或相關結果,而不再是傳統的包含"劉德華"、"圖片"字眼的結果。
[0047] 圖3b和圖3c分別是對於搜索詞葡萄牙語"a vassoura da bruxa"(巫師的掃把) 和阿拉伯語(美麗的阿巴利亞晚禮服)得到的搜索結果。
[0048] 本發明實施例的搜索需求分析方法,通過獲取搜索詞對應的多個關聯詞,並分別 抽取搜索詞的特徵和多個關聯詞的特徵,根據搜索詞的特徵和關聯詞的特徵獲取搜索需 求,能夠準確地獲取用戶的搜索需求,從而搜尋引擎根據用戶的搜索需求提供更符合用戶 需要的搜索結果,進而在提高了搜索的準確率的同時,還提高了搜索的召回率。此外,搜索 需求的分析過程與語言無關,因此可方便地在多個不同語種之間進行遷移,更加方便。
[0049] 為了實現上述實施例,本發明還提出一種搜索需求分析裝置。
[0050] -種搜索需求分析裝置,包括:第一獲取模塊,用於獲取搜索詞,並獲取搜索詞對 應的多個關聯詞;抽取模塊,用於抽取搜索詞的特徵並作為原始特徵,並抽取多個關聯詞的 特徵並作為關聯特徵;以及第二獲取模塊,用於根據原始特徵和關聯特徵獲取搜索需求。
[0051] 圖4為根據本發明一個實施例的搜索需求分析裝置的結構示意圖。
[0052] 如圖4所示,根據本發明實施例的搜索需求分析裝置,包括:第一獲取模塊10、抽 取模塊20和第二獲取模塊30。
[0053] 具體地,第一獲取模塊10用於獲取搜索詞,並獲取搜索詞對應的多個關聯詞。
[0054] 其中,搜索詞為用戶進行搜索時輸入的,可以是一個詞語或者多個詞語的組合。關 聯詞是與搜索詞字面相近或者語義相近的詞語。舉例來說,對於搜索詞"劉德華的圖片",對 應的關聯詞可為"劉德華頭像"、"劉德華圖片版"、"劉德華寫真"、"精選華仔圖片"和"劉德 華壁紙"等。
[0055] 更具體地,在本發明的實施例中,第一獲取模塊10具體用於:以搜索詞為中心將 與搜索詞之間的編輯距離小於預設距離的詞作為關聯詞;和/或對搜索詞進行語義分析, 並將與搜索詞語義近似的詞作為關聯詞。
[0056] 其中,編輯距離是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數, 可用於表示詞串之間的相似度。因此,第一獲取模塊10可通過編輯距離從搜索詞的組成結 構上挖掘出與搜索詞字面相關聯的關聯詞。
[0057] 通過對搜索詞進行語義分析,第一獲取模塊10可從語義上挖掘出與搜索詞相關 聯的關聯詞。
[0058] 此外,為了能夠全面地獲取搜索詞對應的關聯詞,第一獲取模塊10可同時從字面 以及語義兩方面挖掘搜索詞的關聯詞。
[0059] 抽取模塊20用於抽取搜索詞的特徵並作為原始特徵,並抽取多個關聯詞的特徵 並作為關聯特徵。
[0060] 更具體地,在本發明的實施例中,如圖5所示,抽取模塊20可具體包括:第一提取 單元21、第二提取單元22和生成單元23,並通過第一提取單元21、第二提取單元22和生成 單元23抽取搜索詞的特徵並作為原始特徵。其中 :
[0061] 第一提取單元21用於提取搜索詞中的專名、專名類別以及各個成分的語義TAG標 籤信息;其中,專名是用於指稱實體的詞或詞組,舉例來說,可以分為人名、地名、朝代名、種 族名、國名、機構名等不同的專名類別。
[0062] 語義TAG信息為搜索詞中各個成分的語義標籤。舉例來說對於搜索詞中的一個成 分"劉德華"的語義標籤可以是"電影演員"、"歌手"、"港臺明星"、"華仔"等。
[0063] 第二提取單元22用於提取搜索詞的組成結構;
[0064] 生成單元23用於根據搜索詞中的專名、專名類別、各個成分的語義TAG信息以及 組成結構生成搜索詞的描述模板,並將描述模板作為原始特徵。
[0065] 在本發明的實施例中,如圖5所示,一方面抽取模塊20可通過分詞單元24和選擇 單元25對關聯詞本身進行分析以抽取搜索詞的特徵,其中 :
[0066] 分詞單元24用於對關聯詞進行分詞以抽取與搜索詞相關且不包含搜索詞的多個 關鍵詞;
[0067] 選擇單元25用於從多個關鍵詞中選擇與搜索詞需求相關的特徵詞,並將特徵詞 作為多個關聯詞的特徵。
[0068] 舉例來說,如果對關聯詞進行分詞後得到一個不包含搜索詞的關鍵詞有"壁紙"、 "寫真"、"精選"等,則可得到與搜索詞需求相關的特徵詞"壁紙"和"寫真",並作為關聯特 徵。
[0069] 另一方面,抽取模塊20還可通過獲取單元26和抽取單元27對根據關聯詞獲取的 搜索結果或通過對用戶點擊日誌進行分析以抽取搜索詞的特徵,其中:
[0070] 獲取單元26用於獲取多個關聯詞的多個搜索結果或用戶點擊日誌;
[0071] 抽取單元27用於從多個關聯詞的多個搜索結果或用戶點擊日誌中抽取關聯詞的 Title特徵、搜索特徵和點擊特徵中的一種或多種,並將Title特徵、搜索特徵和點擊特徵 中的一種或多種作為關聯特徵。
[0072] 第二獲取模塊30用於根據原始特徵和關聯特徵獲取搜索需求。
[0073] 在本發明的一個實施例中,第二獲取模塊30具體用於:根據原始特徵和關聯特徵 查詢搜索需求識別模型以獲取搜索需求。
[0074] 從而,搜尋引擎可根據得到的搜索需求獲取更符合用戶需要的結果。因此,更能符 合用戶需求,提高了搜索的準確率更高,另外,能夠比較全面地獲取與搜索詞相關的搜索結 果,提高了搜索的召回率。
[0075] 具體地,搜索效果可如圖3所示,圖3a、圖3b和圖3c分別為根據本發明實施例的 中文、葡萄牙語、阿拉伯語的搜索結果示意圖。
[0076] 如圖3a所示,對於搜索詞"劉德華的圖片",搜索結果主要是關於劉德華的圖片類 或相關結果,而不再是傳統的包含"劉德華"、"圖片"字眼的結果。
[0077] 圖3b和圖3c分別是對於搜索詞葡萄牙語"a vassoura da bruxa"(巫師的掃把) 和阿拉伯語"(美麗的阿巴利亞晚禮服)得到的搜索結果。
[0078] 本發明實施例的搜索需求分析裝置,通過獲取搜索詞對應的多個關聯詞,並分別 抽取搜索詞的特徵和多個關聯詞的特徵,根據搜索詞的特徵和關聯詞的特徵獲取搜索需 求,能夠準確地獲取用戶的搜索需求,從而搜尋引擎根據用戶的搜索需求提供更符合用戶 需要的搜索結果,進而在提高了搜索的準確率的同時,還提高了搜索的召回率。此外,搜索 需求的分析過程與語言無關,因此可方便地在多個不同語種之間進行遷移,更加方便。
[0079] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括 一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部 分,並且本發明的優選實施方式的範圍包括另外的實現,其中可以不按所示出或討論的順 序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明 的實施例所屬【技術領域】的技術人員所理解。
[0080] 在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是 用於實現邏輯功能的可執行指令的定序列表,可以具體實現在任何計算機可讀介質中,以 供指令執行系統、裝置或設備(如基於計算機的系統、包括處理器的系統或其他可以從指 令執行系統、裝置或設備取指令並執行指令的系統)使用,或結合這些指令執行系統、裝置 或設備而使用。就本說明書而言,"計算機可讀介質"可以是任何可以包含、存儲、通信、傳 播或傳輸程序以供指令執行系統、裝置或設備或結合這些指令執行系統、裝置或設備而使 用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個 布線的電連接部(電子裝置),可攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀 存儲器(R0M),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及可攜式光 盤只讀存儲器(⑶ROM)。另外,計算機可讀介質甚至可以是可在其上列印所述程序的紙或其 他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必 要時以其他合適方式進行處理來以電子方式獲得所述程序,然後將其存儲在計算機存儲器 中。
[0081] 應當理解,本發明的各部分可以用硬體、軟體、固件或它們的組合來實現。在上述 實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟體 或固件來實現。例如,如果用硬體來實現,和在另一實施方式中一樣,可用本領域公知的下 列技術中的任一項或他們的組合來實現:具有用於對數據信號實現邏輯功能的邏輯門電路 的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現場 可編程門陣列(FPGA)等。
[0082] 本【技術領域】的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步 驟是可以通過程序來指令相關的硬體完成,所述的程序可以存儲於一種計算機可讀存儲介 質中,該程序在執行時,包括方法實施例的步驟之一或其組合。
[0083] 此外,在本發明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模 塊既可以採用硬體的形式實現,也可以採用軟體功能模塊的形式實現。所述集成的模塊如 果以軟體功能模塊的形式實現並作為獨立的產品銷售或使用時,也可以存儲在一個計算機 可讀取存儲介質中。
[0084] 上述提到的存儲介質可以是只讀存儲器,磁碟或光碟等。
[0085] 在本說明書的描述中,參考術語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特 點包含於本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不 一定指的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任何 的一個或多個實施例或示例中以合適的方式結合。
[0086] 儘管已經示出和描述了本發明的實施例,本領域的普通技術人員可以理解:在不 脫離本發明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本 發明的範圍由權利要求及其等同限定。
【權利要求】
1. 一種搜索需求分析方法,其特徵在於,包括w下步驟: 獲取搜索詞,並獲取所述搜索詞對應的多個關聯詞; 抽取所述搜索詞的特徵並作為原始特徵,並抽取所述多個關聯詞的特徵並作為關聯特 徵;W及 根據所述原始特徵和所述關聯特徵獲取搜索需求。
2. 如權利要求1所述的搜索需求分析方法,其特徵在於,所述根據所述原始特徵和所 述關聯特徵獲取搜索需求具體包括: 根據所述原始特徵和所述關聯特徵查詢搜索需求識別模型W獲取所述搜索需求。
3. 如權利要求1所述的搜索需求分析方法,其特徵在於,所述獲取所述搜索詞對應的 多個關聯詞具體包括: W所述搜索詞為中也將與所述搜索詞之間的編輯距離小於預設距離的詞作為所述關 聯詞;和/或 對所述搜索詞進行語義分析,並將與所述搜索詞語義近似的詞作為所述關聯詞。
4. 如權利要求1所述的搜索需求分析方法,其特徵在於,所述抽取所述搜索詞的特徵 並作為原始特徵具體包括: 提取所述搜索詞中的專名、專名類別W及各個成分的語義TAG標籤信息; 提取所述搜索詞的組成結構; 根據所述搜索詞中的專名、所述專名類別、所述各個成分的語義TAG信息W及所述組 成結構生成所述搜索詞的描述模板,並將所述描述模板作為所述原始特徵。
5. 如權利要求1所述的搜索需求分析方法,其特徵在於,所述抽取所述多個關聯詞的 特徵並作為關聯特徵具體包括: 對所述關聯詞進行分詞W抽取與所述搜索詞相關且不包含所述搜索詞的多個關鍵 詞; 從所述多個關鍵詞中選擇與所述搜索詞需求相關的特徵詞,並將所述特徵詞作為所述 多個關聯詞的特徵。
6. 如權利要求1所述的搜索需求分析方法,其特徵在於,所述抽取所述多個關聯詞的 特徵並作為關聯特徵具體包括: 獲取所述多個關聯詞的多個搜索結果或用戶點擊日誌;W及 從所述多個關聯詞的多個搜索結果或用戶點擊日誌中抽取所述關聯詞的Title特徵、 搜索特徵和點擊特徵中的一種或多種,並將所述Title特徵、搜索特徵和點擊特徵中的一 種或多種作為所述關聯特徵。
7. -種搜索需求分析裝置,其特徵在於,包括: 第一獲取模塊,用於獲取搜索詞,並獲取所述搜索詞對應的多個關聯詞; 抽取模塊,用於抽取所述搜索詞的特徵並作為原始特徵,並抽取所述多個關聯詞的特 徵並作為關聯特徵;W及 第二獲取模塊,用於根據所述原始特徵和所述關聯特徵獲取搜索需求。
8. 如權利要求7所述的搜索需求分析裝置,其特徵在於,所述第二獲取模塊具體用於: 根據所述原始特徵和所述關聯特徵查詢搜索需求識別模型W獲取所述搜索需求。
9. 如權利要求7所述的搜索需求分析裝置,其特徵在於,所述第一獲取模塊具體用於: w所述搜索詞為中也將與所述搜索詞之間的編輯距離小於預設距離的詞作為所述關 聯詞;和/或 對所述搜索詞進行語義分析,並將與所述搜索詞語義近似的詞作為所述關聯詞。
10. 如權利要求7所述的搜索需求分析裝置,其特徵在於,所述抽取模塊具體包括: 第一提取單元,用於提取所述搜索詞中的專名、專名類別W及各個成分的語義TAG標 籤信息; 第二提取單元,用於提取所述搜索詞的組成結構; 生成單元,用於根據所述搜索詞中的專名、所述專名類別、所述各個成分的語義TAG信 息W及所述組成結構生成所述搜索詞的描述模板,並將所述描述模板作為所述原始特徵。
11. 如權利要求7所述的搜索需求分析裝置,其特徵在於,所述抽取模塊具體包括: 分詞單元,用於對所述關聯詞進行分詞W抽取與所述搜索詞相關且不包含所述搜索詞 的多個關鍵詞; 選擇單元,用於從所述多個關鍵詞中選擇與所述搜索詞需求相關的特徵詞,並將所述 特徵詞作為所述多個關聯詞的特徵。
12. 如權利要求7所述的搜索需求分析裝置,其特徵在於,所述抽取模塊具體包括: 獲取單元,用於獲取所述多個關聯詞的多個搜索結果或用戶點擊日誌;W及 抽取單元,用於從所述多個關聯詞的多個搜索結果或用戶點擊日誌中抽取所述關聯詞 的Title特徵、搜索特徵和點擊特徵中的一種或多種,並將所述Title特徵、搜索特徵和點 擊特徵中的一種或多種作為所述關聯特徵。
【文檔編號】G06F17/30GK104462272SQ201410687222
【公開日】2015年3月25日 申請日期:2014年11月25日 優先權日:2014年11月25日
【發明者】付志宏, 周古月, 賀旭, 何徑舟, 石磊 申請人:百度在線網絡技術(北京)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀