信息推薦方法和裝置製造方法
2023-05-30 00:17:21 1
信息推薦方法和裝置製造方法
【專利摘要】本發明公開了一種信息推薦方法和裝置。其中,信息推薦方法包括:S1、獲得來自客戶端的查詢信息,並對查詢信息進行識別,獲得識別結果;S2、根據查詢信息獲得相關資源,根據相關資源提取候選答案,並對候選答案進行排序,獲得排序結果;S3、根據排序結果和識別結果獲得答案,並向客戶端返回答案,以使客戶端在搜索結果頁上顯示答案。本發明實施例通過根據查詢信息獲得識別結果和相關資源,並對根據相關資源提取的候選答案進行排序,以及根據識別結果和排序結果獲得答案,並向客戶端返回答案,擴展了搜索結果頁面的核心內容的結構化展現的覆蓋面,節省了獲取精確答案的時間,降低了用戶推理成本,提升了用戶篩選搜索結果的效率。
【專利說明】信息推薦方法和裝置
【技術領域】
[0001] 本發明涉及網際網路【技術領域】,尤其涉及一種信息推薦方法和裝置。
【背景技術】
[0002] 隨著網際網路技術的不斷發展,搜尋引擎已成為人們生活中必不可少的部分。用戶 要查詢網際網路中的信息時,可通過客戶端輸入查詢信息,搜尋引擎可根據查詢信息進行搜 索,在獲得搜索結果後,向客戶端返回與查詢信息相關的搜索結果。通常情況下,搜索結果 可包括:標題、網頁摘要、URL (Uniform Resource Locator,統一資源定位符)、時間等信息。 用戶可通過查看網頁摘要或者點擊URL進入相關網頁,進一步地獲取所需的信息。在展現 獲取的搜索結果時,可通過增加配圖、子連結等輔助性內容,對搜索結果的展現進行優化。 例如:對於新聞類的搜索結果,可展現新聞來源、時間等輔助性參數;對於問答類的搜索結 果,可展現提問者的具體描述、回答數量、提問時間等輔助性參數。同時,對搜索結果頁面的 核心內容也可進行結構化展現。
[0003] 但是,在實現本發明的過程中發明人發現現有技術至少存在以下問題:搜尋引擎 提供的搜索結果不直觀,用戶需要遍歷多個搜索結果尋找相關信息,還需要點擊進入搜索 結果對應的網頁連結,閱讀網頁的內容才能獲取自己所需的答案,不僅耗費時間,用戶推理 成本高,且有遺漏重要信息的風險。對於輔助性參數的展現和搜索結果頁面的核心內容的 結構化展現,不夠靈活,覆蓋面低,對獲取用戶真正需要的答案幫助不大。
【發明內容】
[0004] 本發明旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本發明的 第一個目的在於提出一種信息推薦方法。該方法能夠擴展搜索結果頁面的核心內容的結構 化展現的覆蓋面,節省獲取精確答案的時間,降低用戶推理成本,提升用戶篩選搜索結果的 效率。
[0005] 本發明的第二個目的在於提出另一種信息推薦方法。
[0006] 本發明的第三個目的在於提出一種信息推薦裝置。
[0007] 本發明的第四個目的在於提出另一種信息推薦裝置。
[0008] 為達上述目的,根據本發明第一方面實施例提出了一種信息推薦方法,包括:S1、 獲得來自客戶端的查詢信息,並對所述查詢信息進行識別,獲得識別結果;S2、根據所述查 詢信息獲得相關資源,根據所述相關資源提取候選答案,並對所述候選答案進行排序,獲得 排序結果;以及S3、根據所述排序結果和所述識別結果獲得答案,並向所述客戶端返回所 述答案,以使所述客戶端在搜索結果頁上顯示所述答案。
[0009] 本發明實施例的信息推薦方法,通過根據查詢信息獲得識別結果和相關資源,並 對根據相關資源提取的候選答案進行排序,以及根據識別結果和排序結果獲得答案,並向 客戶端返回答案,擴展了搜索結果頁面的核心內容的結構化展現的覆蓋面,節省了獲取精 確答案的時間,降低了用戶推理成本,提升了用戶篩選搜索結果的效率。
[0010] 為達上述目的,根據本發明第二方面實施例提出了一種信息推薦方法,包括:S4、 接收查詢信息,並向搜尋引擎發送所述查詢信息,以使搜尋引擎對所述查詢信息進行識別, 獲得識別結果,並對根據所述查詢信息獲得的資源進行排序處理,獲得排序結果,然後根據 所述識別結果和所述排序結果獲得答案,並返回所述答案;以及S5、接收來自所述搜索引 擎的答案,並在提供的搜索結果頁上顯示所述答案。
[0011] 本發明實施例的信息推薦方法,通過接收來自搜尋引擎的答案,並在提供的搜索 結果頁上顯示答案,為用戶提供了更精準的答案,節省了獲取精確答案的時間,降低了用戶 推理成本,提升了用戶篩選搜索結果的效率。
[0012] 為達上述目的,根據本發明第三方面實施例提出了一種信息推薦裝置,包括:識別 模塊,用於獲得來自客戶端的查詢信息,並對所述查詢信息進行識別,獲得識別結果;排序 模塊,用於根據所述查詢信息獲得相關資源,根據所述相關資源提取候選答案,並對所述候 選答案進行排序,獲得排序結果;以及獲得模塊,用於根據所述排序結果和所述識別結果獲 得答案,並向所述客戶端返回所述答案,以使所述客戶端在搜索結果頁上顯示所述答案。
[0013] 本發明實施例的信息推薦裝置,通過根據查詢信息獲得識別結果和相關資源,並 對根據相關資源提取的候選答案進行排序,以及根據識別結果和排序結果獲得答案,並向 客戶端返回答案,擴展了搜索結果頁面的核心內容的結構化展現的覆蓋面,節省了獲取精 確答案的時間,降低了用戶推理成本,提升了用戶篩選搜索結果的效率。
[0014] 為達上述目的,根據本發明第四方面實施例提出了一種信息推薦裝置,包括:處 理模塊,用於接收查詢信息,並向搜尋引擎發送所述查詢信息,以使搜尋引擎對所述查詢信 息進行識別,獲得識別結果,並對根據所述查詢信息獲得的資源進行排序處理,獲得排序結 果,然後根據所述識別結果和所述排序結果獲得答案,並返回所述答案;以及顯示模塊,用 於接收來自所述搜尋引擎的答案,並在提供的搜索結果頁上顯示所述答案。
[0015] 本發明實施例的信息推薦裝置,通過接收來自搜尋引擎的答案,並在提供的搜索 結果頁上顯示答案,為用戶提供了更精準的答案,節省了獲取精確答案的時間,降低了用戶 推理成本,提升了用戶篩選搜索結果的效率。
[0016] 本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發明的實踐了解到。
【專利附圖】
【附圖說明】
[0017] 圖1是根據本發明一個實施例的信息推薦方法的流程圖。
[0018] 圖2是根據本發明另一個實施例的信息推薦方法的流程圖。
[0019] 圖3是根據本發明一個實施例的當答案的個數不確定時在搜索結果頁上顯示答 案的效果示意圖。
[0020] 圖4是根據本發明一個實施例的當答案的個數為一個時在搜索結果頁上顯示答 案的效果示意圖。
[0021] 圖5是根據本發明一個實施例的當答案的個數為預定數量時在搜索結果頁上顯 示答案的效果示意圖。
[0022] 圖6是根據本發明一個實施例的信息推薦裝置的結構示意圖。
[0023] 圖7是根據本發明另一個實施例的信息推薦裝置的結構示意圖。
【具體實施方式】
[0024] 下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用於解釋本發明,而不能理解為對本發明的限制。
[0025] 下面參考附圖描述本發明實施例的信息推薦方法和裝置。
[0026] 圖1是根據本發明一個實施例的信息推薦方法的流程圖,本實施例從搜尋引擎側 進行描述。
[0027] 如圖1所示,該信息推薦方法,包括:
[0028] S1,獲得來自客戶端的查詢信息,並對查詢信息進行識別,獲得識別結果。
[0029] 在本發明的實施例中,搜尋引擎可獲得用戶通過客戶端輸入的查詢信息,然後從 查詢信息中識別出查詢信息對應的問題的焦點和問題的答案類型等信息,並對答案類型進 行歸一化處理,獲得答案類型的歸一化結果,同時獲得問題的答案個數。
[0030] 具體地,焦點是問題答案的引用,可以代替答案,用來構成完整的陳述句。對焦點 的識別,主要是通過規則進行識別,如具有疑問詞的問題,焦點是疑問詞;沒有疑問詞的問 題,焦點默認為空。例如:問題為"2013年溫網女單冠軍是誰",則焦點為"是誰"。
[0031] 對問題的答案類型進行識別,即識別用戶需要的答案屬於哪種類型,主要分為規 則和模型學習兩種方法。在規則識別的方法中,問題的答案類型為焦點的前一個詞。例如: "2013年溫網女單冠軍是誰",問題的答案類型為"冠軍"。模型學習的方法,則是利用依存 句法分析等工具,生成訓練語料和訓練模型,以此識別答案類型。
[0032] 在識別出問題的答案類型後,可獲得答案類型的歸一化結果,即將答案類型映射 到固定類別體系中。主要方法通常基於答案規則或答案詞表進行歸一化。例如:答案類型 為"冠軍",則歸一化結果為"人物"。
[0033] 獲得問題的答案個數可通過當前問題語境進行判定。例如:問題為"野生動物有 哪些",則該問題的答案個數為成千上萬。一般答案個數大於8個的,可定義為泛需求。再 例如:問題為"中國古代四大美女",該問題的答案個數為4個。而對於問題"2013年溫網女 單冠軍是誰",該問題的答案個數為1個,因為根據當前問題語境,"冠軍"只有一個。
[0034] 此外,還可通過基礎詞法分析對查詢信息進行識別。詞法分析可包括:切詞、專名 識別、重要性計算、依存句法分析等。
[0035] S2,根據查詢信息獲得相關資源,根據相關資源提取候選答案,並對候選答案進行 排序,獲得排序結果。
[0036] 在本發明的實施例中,搜尋引擎在獲得查詢信息後,可根據查詢信息獲得相關資 源。其中,相關資源可包括搜索結果、對應的網頁文檔以及網頁文檔的點擊日誌等。具體地, 搜索結果可包括摘要、URL等基本信息;通過點擊URL,可獲取對應的網頁文檔,網頁文檔的 正文內容可用於深度分析問題和答案;通過網頁文檔的點擊日誌,可分析各個網頁摘要或 正文對於問題的重要程度。
[0037] 在獲得相關資源後,搜尋引擎可根據相關資源提取候選答案,並對候選答案進行 排序,獲得排序結果。
[0038] 具體地,搜尋引擎可基於文檔相關性對網頁文檔進行排序,獲得候選文檔集合。更 具體地,搜尋引擎可根據查詢信息中的關鍵詞獲得網頁文檔,然後根據網頁文檔的點擊日 志的重要程度,結合語義相似度計算等,對網頁文檔進行相關性排序,從而獲得候選文檔集 合。其中,語義相似度計算主要是通過關鍵詞的重要性、關鍵詞的同義詞替換、關鍵詞的改 寫等,計算出查詢信息與網頁文檔題目的相似度。
[0039] 在獲得候選文檔集合後,搜尋引擎可從候選文檔集合中提取出候選片段,並從候 選片段中提取出候選答案。具體地,首先以段落或多個句子為單位對候選文檔進行劃分,然 後獲得候選片段,再計算出候選片段與查詢信息的相似度、候選片段與查詢信息的相關性 以及候選文檔的相關性權值,根據上述特徵提取出候選答案。
[0040] 在提取出候選答案後,搜尋引擎可對候選答案進行預排序,獲得第一排序結果。具 體地,可基於第一特徵計算候選答案置信度,並基於候選答案置信度的計算結果對候選答 案進行排序,獲得第一排序結果。其中,第一特徵可包括但不限於候選答案的來源文檔的相 關性、候選答案的來源片段的相關性、候選答案與答案類型的匹配度和候選答案在網頁文 檔中出現的次數中的一種或多種。
[0041] 搜尋引擎對候選答案進行預排序,可避免過多的候選答案進入二次排序,對排序 結果產生影響。
[0042] 在獲得第一排序結果後,搜尋引擎可對第一排序結果進行二次排序處理,獲得排 序結果。具體地,獲得排序結果可通過多種方式實現,例如以下幾種方式:
[0043] 第一種方式,可基於詞典對第一排序結果進行過濾,獲得排序結果。例如:"金毛 犬"屬於狗類,"墨龍睛"屬於魚類。若問題類型為狗,則基於詞典,可將候選答案"墨龍睛" 過濾。其中,詞典的構建主要通過定向站點結構化數據挖掘(如小說網站挖掘小說實體)、 大規模網際網路無結構化/半結構化數據挖掘和校驗(如利用知識類社區的分類標籤挖掘實 體)、查詢信息日誌挖掘(如查詢信息為"天龍八部電影",可挖掘出電影實體"天龍八部") 等算法進行構建。
[0044] 第二種方式,還可基於第二特徵對第一排序結果進行二次排序,獲得排序結果。其 中,第二特徵可包括候選答案與答案類型的匹配度、候選答案與查詢信息的共現度和候選 答案在網頁文檔中出現的次數中的一種或多種。
[0045] 其中,候選答案與答案類型的匹配度主要用于衡量候選答案與查詢信息的匹配 度,是通過語料中統計的查詢信息的擴展向量與候選答案的擴展向量的匹配度計算獲得 的。候選答案與查詢信息的共現度主要用于衡量查詢信息在候選答案的語境中的重要程 度。對於實體類的答案,共現度可通過實體庫中的信息與查詢信息中的關鍵詞進行計算。
[0046] 另外,還可根據候選答案在網頁文檔中出現的次數對第一排序結果進行二次排 序。例如:每個網頁文檔可當作一個舉證來源,候選答案在一個網頁文檔中出現過,則該候 選答案獲得一票。當候選答案在5個網頁文檔中出現過,則該候選答案獲得5票。最終票 數越高的候選答案,可信度越高,排序時排名越靠前。
[0047] 第三種方式,搜尋引擎還可將候選答案代入查詢信息進行二次檢索,根據檢索結 果生成排序結果。例如,獲取更多的與候選答案相關的信息,根據相關的信息提取和計算 新的特徵,並基於新的特徵進行計算和重排序,最終生成新的排序結果。
[0048] 具體地,可將候選答案替換掉查詢信息中的焦點,帶入查詢信息進行二次檢索,然 後統計獲得的檢索結果與候選答案的相關信息。如:查詢信息與候選答案在二次檢索返回 的網頁文檔中是否連貫出現、查詢信息與候選答案的共現信息、查詢信息中關鍵詞的命中 情況等。如果當前網頁文檔的標題是問題類標題,則對標題進行焦點識別、答案類型識別; 如果查詢信息無焦點,則將候選答案加到查詢信息的末尾,以分隔符分割後進行二次檢索。 在進行二次檢索獲得檢索結果後,根據檢索結果生成排序結果。
[0049] S3,根據排序結果和識別結果獲得答案,並向客戶端返回答案,以使客戶端在搜索 結果頁上顯示答案。
[0050] 在本發明的實施例中,搜尋引擎可根據問題的答案個數從排序結果中選擇對應數 量的答案,即按照先後順序獲得對應數量的答案,並向客戶端返回答案及其對應的網頁文 檔。
[0051] 本發明實施例的信息推薦方法,通過根據查詢信息獲得識別結果和相關資源,並 對根據相關資源提取的候選答案進行排序,以及根據識別結果和排序結果獲得答案,並向 客戶端返回答案,擴展了搜索結果頁面的核心內容的結構化展現的覆蓋面,提升了用戶篩 選搜索結果的效率,節省了獲取精確答案的時間,降低了用戶推理成本。
[0052] 圖2是根據本發明另一個實施例的信息推薦方法的流程圖,本實施例從客戶端側 進行描述。
[0053] 如圖2所示,該信息推薦方法包括:
[0054] S4,接收查詢信息,並向搜尋引擎發送查詢信息,以使搜尋引擎對查詢信息進行識 另IJ,獲得識別結果,並對根據查詢信息獲得的資源進行排序處理,獲得排序結果,然後根據 識別結果和排序結果獲得答案,並返回答案。
[0055] 在本發明的實施例中,客戶端可接收用戶輸入的查詢信息,並向搜尋引擎發送查 詢信息。搜尋引擎在接收到查詢信息後,可對該查詢信息進行識別,獲得識別結果,然後根 據查詢信息獲得的資源進行排序處理,獲得排序結果。最後根據識別結果和排序結果獲得 答案,並向客戶端返回答案。
[0056] 搜尋引擎獲得答案的過程,可參見搜尋引擎側的實施例,此處不贅述。
[0057] S5,接收來自搜尋引擎的答案,並在提供的搜索結果頁上顯示答案。
[0058] 在本發明的實施例中,在獲得搜尋引擎返回的答案後,客戶端可接收與答案對應 的網頁文檔,並在搜索結果頁上顯示提供答案的文檔的詳情信息。該詳情信息可包括答案 的個數及其對應網頁文檔的摘要。
[0059] 當答案的個數不確定時,客戶端可在搜索結果頁上顯示預定數量的答案和用於展 開顯示剩餘答案的擴展按鍵。如圖3所示,查詢信息為"夏天吃什麼好呢",經過搜尋引擎的 檢索,在展現對應網頁文檔的摘要同時,還展現獲得的答案"水果"、"茄子"、"西瓜"、"蔬菜"、 "蘿蔔",剩餘的多個答案可通過點擊擴展按鍵"查看詳情"進入到中間頁面,來進行展現。
[0060] 當答案的個數為一個時,客戶端可在搜索結果頁上顯示答案及其相關的連結信 息。如圖4所示,答案為"巴託麗",並顯示獲取該答案的連結。
[0061] 當答案的個數為預定數量時,客戶端可在搜索結果頁上顯示預定數量的答案的鏈 接信息。如圖5所示,答案為"曼施坦因"、"隆美爾"、"古德裡安",並顯示3個答案分別對應 的連結。
[0062] 本發明實施例的信息推薦方法,通過接收來自搜尋引擎的答案,並在提供的搜索 結果頁上顯示答案,為用戶提供了更精準的答案,提升了用戶篩選搜索結果的效率,節省了 獲取精確答案的時間,降低了用戶推理成本。
[0063] 為了實現上述實施例,本發明還提出一種信息推薦裝置。
[0064] 圖6是根據本發明一個實施例的信息推薦裝置的結構示意圖。
[0065] 如圖6所示,該信息推薦裝置包括:識別模塊110、排序模塊120和獲得模塊130。 [0066] 其中,識別模塊110用於獲得來自客戶端的查詢信息,並對查詢信息進行識別,獲 得識別結果。
[0067] 在本發明的實施例中,識別模塊110可獲得用戶通過客戶端輸入的查詢信息,然 後從查詢信息中識別出查詢信息對應的問題的焦點和問題的答案類型等信息,並對答案類 型進行歸一化處理,獲得答案類型的歸一化結果,同時獲得問題的答案個數。
[0068] 具體地,焦點是問題答案的引用,可以代替答案,用來構成完整的陳述句。對焦點 的識別,主要是通過規則進行識別,如具有疑問詞的問題,焦點是疑問詞;沒有疑問詞的問 題,焦點默認為空。例如:問題為"2013年溫網女單冠軍是誰",則焦點為"是誰"。
[0069] 對問題的答案類型進行識別,即識別用戶需要的答案屬於哪種類型,主要分為規 則和模型學習兩種方法。在規則識別的方法中,問題的答案類型為焦點的前一個詞。例如: "2013年溫網女單冠軍是誰",問題的答案類型為"冠軍"。模型學習的方法,則是利用依存 句法分析等工具,生成訓練語料和訓練模型,以此識別答案類型。
[0070] 在識別模塊110識別出問題的答案類型後,識別模塊110可獲得答案類型的歸一 化結果,即將答案類型映射到固定類別體系中。主要方法通常基於答案規則或答案詞表進 行歸一化。例如:答案類型為"冠軍",則歸一化結果為"人物"。
[0071] 獲得問題的答案個數可通過當前問題語境進行判定。例如:問題為"野生動物有 哪些",則該問題的答案個數為成千上萬。一般答案個數大於8個的,可定義為泛需求。再 例如:問題為"中國古代四大美女",該問題的答案個數為4個。而對於問題"2013年溫網女 單冠軍是誰",該問題的答案個數為1個,因為根據當前問題語境,"冠軍"只有一個。
[0072] 此外,識別模塊110還可通過基礎詞法分析對查詢信息進行識別。詞法分析可包 括:切詞、專名識別、重要性計算、依存句法分析等。
[0073] 排序模塊120用於根據查詢信息獲得相關資源,根據相關資源提取候選答案,並 對候選答案進行排序,獲得排序結果。
[0074] 在本發明的實施例中,在獲得查詢信息後,排序模塊120可根據查詢信息獲得相 關資源。其中,相關資源可包括搜索結果、對應的網頁文檔以及網頁文檔的點擊日誌等。具 體地,搜索結果可包括摘要、URL等基本信息;通過點擊URL,可獲取對應的網頁文檔,網頁 文檔的正文內容可用於深度分析問題和答案;通過網頁文檔的點擊日誌,可分析各個網頁 摘要或正文對於問題的重要程度。
[0075] 在排序模塊120獲得相關資源後,排序模塊120可根據相關資源提取候選答案,並 對候選答案進行排序,獲得排序結果。
[0076] 具體地,排序模塊120可基於文檔相關性對網頁文檔進行排序,獲得候選文檔集 合。更具體地,排序模塊120可根據查詢信息中的關鍵詞獲得網頁文檔,然後根據網頁文檔 的點擊日誌的重要程度,結合語義相似度計算等,對網頁文檔進行相關性排序,從而獲得候 選文檔集合。其中,語義相似度計算主要是通過關鍵詞的重要性、關鍵詞的同義詞替換、關 鍵詞的改寫等,計算出查詢信息與網頁文檔題目的相似度。
[0077] 在獲得候選文檔集合後,排序模塊120可從候選文檔集合中提取出候選片段,並 從候選片段中提取出候選答案。具體地,首先以段落或多個句子為單位對候選文檔進行劃 分,然後獲得候選片段,再計算出候選片段與查詢信息的相似度、候選片段與查詢信息的相 關性以及候選文檔的相關性權值,根據上述特徵提取出候選答案。
[0078] 在提取出候選答案後,排序模塊120可對候選答案進行預排序,獲得第一排序結 果。具體地,排序模塊120可基於第一特徵計算候選答案置信度,並基於候選答案置信度的 計算結果對候選答案進行排序,獲得第一排序結果。其中,第一特徵可包括但不限於候選答 案的來源文檔的相關性、候選答案的來源片段的相關性、候選答案與答案類型的匹配度和 候選答案在網頁文檔中出現的次數中的一種或多種。
[0079] 排序模塊120對候選答案進行預排序,可避免過多的候選答案進入二次排序,對 排序結果產生影響。
[0080] 在獲得第一排序結果後,排序模塊120可對第一排序結果進行二次排序處理,獲 得排序結果。具體地,獲得排序結果可通過多種方式實現,例如以下幾種方式:
[0081] 第一種方式,可基於詞典對第一排序結果進行過濾,獲得排序結果。例如:"金毛 犬"屬於狗類,"墨龍睛"屬於魚類。若問題類型為狗,則基於詞典,可將候選答案"墨龍睛" 過濾。其中,詞典的構建主要通過定向站點結構化數據挖掘(如小說網站挖掘小說實體)、 大規模網際網路無結構化/半結構化數據挖掘和校驗(如利用知識類社區的分類標籤挖掘實 體)、查詢信息日誌挖掘(如查詢信息為"天龍八部電影",可挖掘出電影實體"天龍八部") 等算法進行構建。
[0082] 第二種方式,還可基於第二特徵對第一排序結果進行二次排序,獲得排序結果。其 中,第二特徵可包括候選答案與答案類型的匹配度、候選答案與查詢信息的共現度和候選 答案在網頁文檔中出現的次數中的一種或多種。
[0083] 其中,候選答案與答案類型的匹配度主要用于衡量候選答案與查詢信息的匹配 度,是通過語料中統計的查詢信息的擴展向量與候選答案的擴展向量的匹配度計算獲得 的。候選答案與查詢信息的共現度主要用于衡量查詢信息在候選答案的語境中的重要程 度。對於實體類的答案,共現度可通過實體庫中的信息與查詢信息中的關鍵詞進行計算。 [0084] 另外,還可根據候選答案在網頁文檔中出現的次數對第一排序結果進行二次排 序。例如:每個網頁文檔可當作一個舉證來源,候選答案在一個網頁文檔中出現過,則該候 選答案獲得一票。當候選答案在5個網頁文檔中出現過,則該候選答案獲得5票。最終票 數越高的候選答案,可信度越高,排序時排名越靠前。
[0085] 第三種方式,搜尋引擎還可將候選答案代入查詢信息進行二次檢索,根據檢索結 果生成排序結果。例如,獲取更多的與候選答案相關的信息,根據相關的信息提取和計算 新的特徵,並基於新的特徵進行計算和重排序,最終生成新的排序結果。
[0086] 具體地,可將候選答案替換掉查詢信息中的焦點,帶入查詢信息進行二次檢索,然 後統計獲得的檢索結果與候選答案的相關信息。如:查詢信息與候選答案在二次檢索返回 的網頁文檔中是否連貫出現、查詢信息與候選答案的共現信息、查詢信息中關鍵詞的命中 情況等。如果當前網頁文檔的標題是問題類標題,則對標題進行焦點識別、答案類型識別; 如果查詢信息無焦點,則將候選答案加到查詢信息的末尾,以分隔符分割後進行二次檢索。 在進行二次檢索獲得檢索結果後,根據檢索結果生成排序結果。
[0087] 獲得模塊130用於根據排序結果和識別結果獲得答案,並向客戶端返回答案,以 使客戶端在搜索結果頁上顯示答案。
[0088] 在本發明的實施例中,獲得模塊130可根據問題的答案個數從排序結果中選擇對 應數量的答案,即按照先後順序獲得對應數量的答案,並向客戶端返回答案及其對應的網 頁文檔。
[0089] 本發明實施例的信息推薦裝置,通過根據查詢信息獲得識別結果和相關資源,並 對根據相關資源提取的候選答案進行排序,以及根據識別結果和排序結果獲得答案,並向 客戶端返回答案,擴展了搜索結果頁面的核心內容的結構化展現的覆蓋面,提升了用戶篩 選搜索結果的效率,節省了獲取精確答案的時間,降低了用戶推理成本。
[0090] 圖7是根據本發明另一個實施例的信息推薦裝置的結構示意圖。
[0091] 如圖7所示,該信息推薦裝置包括:處理模塊210和顯示模塊220。
[0092] 處理模塊210用於接收查詢信息,並向搜尋引擎發送查詢信息,以使搜尋引擎對 查詢信息進行識別,獲得識別結果,並對根據查詢信息獲得的資源進行排序處理,獲得排序 結果,然後根據識別結果和排序結果獲得答案,並返回答案。
[0093] 在本發明的實施例中,處理模塊210可接收用戶輸入的查詢信息,並向搜尋引擎 發送查詢信息。搜尋引擎在接收到查詢信息後,可對該查詢信息進行識別,獲得識別結果, 然後根據查詢信息獲得的資源進行排序處理,獲得排序結果。最後根據識別結果和排序結 果獲得答案,並向客戶端返回答案。
[0094] 搜尋引擎獲得答案的過程,可參見搜尋引擎側的方法實施例,此處不贅述。
[0095] 顯示模塊220用於接收來自搜尋引擎的答案,並在提供的搜索結果頁上顯示答 案。
[0096] 在本發明的實施例中,顯示模塊220可獲得搜尋引擎返回的答案。
[0097] 此外,顯示模塊220還可接收與答案對應的網頁文檔,並在搜索結果頁上顯示提 供答案的文檔的詳情信息。該詳情信息可包括答案的個數及其對應網頁文檔的摘要。
[0098] 當答案的個數不確定時,顯示模塊220可在搜索結果頁上顯示預定數量的答案和 用於展開顯示剩餘答案的擴展按鍵。如圖3所示,查詢信息為"夏天吃什麼好呢",經過搜索 引擎的檢索,在展現對應網頁文檔的摘要同時,還展現獲得的答案"水果"、"茄子"、"西瓜"、 "蔬菜"、"蘿蔔",剩餘的多個答案可通過點擊擴展按鍵"查看詳情"進入到中間頁面,來進行 展現。
[0099] 當答案的個數為一個時,顯示模塊220可在搜索結果頁上顯示答案及其相關的鏈 接信息。如圖4所示,答案為"巴託麗",並顯示獲取該答案的連結。
[0100] 當答案的個數為預定數量時,顯示模塊220可在搜索結果頁上顯示預定數量的答 案的連結信息。如圖5所示,答案為"曼施坦因"、"隆美爾"、"古德裡安",並顯示3個答案分 別對應的連結。
[0101] 本發明實施例的信息推薦裝置,通過接收來自搜尋引擎的答案,並在提供的搜索 結果頁上顯示答案,為用戶提供了更精準的答案,提升了用戶篩選搜索結果的效率,節省了 獲取精確答案的時間,降低了用戶推理成本。
[0102] 在本說明書的描述中,參考術語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特 點包含於本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不 必須針對的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任 一個或多個實施例或示例中以合適的方式結合。此外,在不相互矛盾的情況下,本領域的技 術人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特徵進行結 合和組合。
[0103] 此外,術語"第一"、"第二"僅用於描述目的,而不能理解為指示或暗示相對重要性 或者隱含指明所指示的技術特徵的數量。由此,限定有"第一"、"第二"的特徵可以明示或 者隱含地包括至少一個該特徵。在本發明的描述中,"多個"的含義是至少兩個,例如兩個, 三個等,除非另有明確具體的限定。
[0104] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括 一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部 分,並且本發明的優選實施方式的範圍包括另外的實現,其中可以不按所示出或討論的順 序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明 的實施例所屬【技術領域】的技術人員所理解。
[0105] 在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是 用於實現邏輯功能的可執行指令的定序列表,可以具體實現在任何計算機可讀介質中,以 供指令執行系統、裝置或設備(如基於計算機的系統、包括處理器的系統或其他可以從指 令執行系統、裝置或設備取指令並執行指令的系統)使用,或結合這些指令執行系統、裝置 或設備而使用。就本說明書而言,"計算機可讀介質"可以是任何可以包含、存儲、通信、傳 播或傳輸程序以供指令執行系統、裝置或設備或結合這些指令執行系統、裝置或設備而使 用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個 布線的電連接部(電子裝置),可攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀 存儲器(R0M),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及可攜式光 盤只讀存儲器(⑶ROM)。另外,計算機可讀介質甚至可以是可在其上列印所述程序的紙或其 他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必 要時以其他合適方式進行處理來以電子方式獲得所述程序,然後將其存儲在計算機存儲器 中。
[0106] 應當理解,本發明的各部分可以用硬體、軟體、固件或它們的組合來實現。在上述 實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟體 或固件來實現。例如,如果用硬體來實現,和在另一實施方式中一樣,可用本領域公知的下 列技術中的任一項或他們的組合來實現:具有用於對數據信號實現邏輯功能的邏輯門電路 的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現場 可編程門陣列(FPGA)等。
[0107] 本【技術領域】的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步 驟是可以通過程序來指令相關的硬體完成,所述的程序可以存儲於一種計算機可讀存儲介 質中,該程序在執行時,包括方法實施例的步驟之一或其組合。
[0108] 此外,在本發明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模 塊既可以採用硬體的形式實現,也可以採用軟體功能模塊的形式實現。所述集成的模塊如 果以軟體功能模塊的形式實現並作為獨立的產品銷售或使用時,也可以存儲在一個計算機 可讀取存儲介質中。
[0109] 上述提到的存儲介質可以是只讀存儲器,磁碟或光碟等。儘管上面已經示出和描 述了本發明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發明的限 制,本領域的普通技術人員在本發明的範圍內可以對上述實施例進行變化、修改、替換和變 型。
【權利要求】
1. 一種信息推薦方法,其特徵在於,包括: 51、 獲得來自客戶端的查詢信息,並對所述查詢信息進行識別,獲得識別結果; 52、 根據所述查詢信息獲得相關資源,根據所述相關資源提取候選答案,並對所述候選 答案進行排序,獲得排序結果;以及 53、 根據所述排序結果和所述識別結果獲得答案,並向所述客戶端返回所述答案,以使 所述客戶端在搜索結果頁上顯示所述答案。
2. 根據權利要求1所述的方法,其特徵在於,所述對所述查詢信息進行識別,獲得識別 結果,包括: 從所述查詢信息中識別出所述查詢信息對應的問題的焦點和所述問題的答案類型,並 獲得所述答案類型的歸一化結果和所述問題的答案個數。
3. 根據權利要求1或2所述的方法,其特徵在於,所述相關資源包括搜索結果、對應的 網頁文檔以及所述網頁文檔的點擊日誌,所述根據所述查詢信息獲得相關資源,根據所述 相關資源提取候選答案,包括: 基於文檔相關性對所述網頁文檔進行排序,獲得候選文檔集合,從所述候選文檔集合 中提取出候選片段,並從所述候選片段中提取出候選答案。
4. 根據權利要求3所述的方法,其特徵在於,所述對所述候選答案進行排序,獲得排序 結果,包括: 對所述候選答案進行預排序,獲得第一排序結果;以及 對所述第一排序結果進行二次排序處理,獲得所述排序結果。
5. 根據權利要求4所述的方法,其特徵在於,所述對所述候選答案進行預排序,獲得第 一排序結果,包括: 基於第一特徵計算候選答案置信度,並基於所述候選答案置信度的計算結果對所述候 選答案進行排序,獲得所述第一排序結果;其中,所述第一特徵包括所述候選答案的來源文 檔的相關性、所述候選答案的來源片段的相關性、所述候選答案與所述答案類型的匹配度 和所述候選答案在所述網頁文檔中出現的次數中的一種或多種。
6. 根據權利要求4所述的方法,其特徵在於,所述對所述第一排序結果進行二次排序 處理,獲得所述排序結果,包括: 基於詞典對所述第一排序結果進行過濾,獲得所述排序結果;或者 基於第二特徵對所述第一排序結果進行二次排序,獲得所述排序結果,其中,所述第二 特徵包括所述候選答案與所述答案類型的匹配度、所述候選答案與所述查詢信息的共現度 和所述候選答案在所述網頁文檔中出現的次數中的一種或多種;或者 將所述候選答案代入所述查詢信息進行二次檢索,根據檢索結果生成所述排序結果。
7. 根據權利要求5或6所述的方法,其特徵在於,所述S3包括: 根據所述問題的答案個數從所述排序結果中選擇對應數量的答案,並向所述客戶端返 回所述答案及其對應的網頁文檔。
8. -種信息推薦方法,其特徵在於,包括: 54、 接收查詢信息,並向搜尋引擎發送所述查詢信息,以使搜尋引擎對所述查詢信息進 行識別,獲得識別結果,並對根據所述查詢信息獲得的資源進行排序處理,獲得排序結果, 然後根據所述識別結果和所述排序結果獲得答案,並返回所述答案;以及 S5、接收來自所述搜尋引擎的答案,並在提供的搜索結果頁上顯示所述答案。
9. 根據權利要求8所述的方法,其特徵在於,在所述接收來自所述搜尋引擎的答案時, 還包括: 接收與所述答案對應的網頁文檔,並在所述搜索結果頁上顯示提供所述答案的文檔的 詳情信息。
10. 根據權利要求8或9所述的方法,其特徵在於,當所述答案的個數不確定時,所述 S5包括:在所述搜索結果頁上顯示預定數量的答案和用於展開顯示剩餘答案的擴展按鍵; 或者 當所述答案的個數為一個時,所述S5包括:在所述搜索結果頁上顯示所述答案及其相 關的連結信息;或者 當所述答案的個數為預定數量時,所述S5包括:在所述搜索結果頁上顯示所述預定數 量的答案的連結信息。
11. 一種信息推薦裝置,其特徵在於,包括: 識別模塊,用於獲得來自客戶端的查詢信息,並對所述查詢信息進行識別,獲得識別結 果; 排序模塊,用於根據所述查詢信息獲得相關資源,根據所述相關資源提取候選答案,並 對所述候選答案進行排序,獲得排序結果;以及 獲得模塊,用於根據所述排序結果和所述識別結果獲得答案,並向所述客戶端返回所 述答案,以使所述客戶端在搜索結果頁上顯示所述答案。
12. 根據權利要求11所述的裝置,其特徵在於,所述識別模塊,具體用於: 從所述查詢信息中識別出所述查詢信息對應的問題的焦點和所述問題的答案類型,並 獲得所述答案類型的歸一化結果和所述問題的答案個數。
13. 根據權利要求11或12所述的裝置,其特徵在於,所述相關資源包括搜索結果、對應 的網頁文檔以及所述網頁文檔的點擊日誌,所述排序模塊,具體用於: 基於文檔相關性對所述網頁文檔進行排序,獲得候選文檔集合,從所述候選文檔集合 中提取出候選片段,並從所述候選片段中提取出候選答案。
14. 根據權利要求13所述的裝置,其特徵在於,所述排序模塊,具體用於: 對所述候選答案進行預排序,獲得第一排序結果;以及 對所述第一排序結果進行二次排序處理,獲得所述排序結果。
15. 根據權利要求14所述的裝置,其特徵在於,所述排序模塊,具體用於: 基於第一特徵計算候選答案置信度,並基於所述候選答案置信度的計算結果對所述候 選答案進行排序,獲得所述第一排序結果;其中,所述第一特徵包括所述候選答案的來源文 檔的相關性、所述候選答案的來源片段的相關性、所述候選答案與所述答案類型的匹配度 和所述候選答案在所述網頁文檔中出現的次數中的一種或多種。
16. 根據權利要求14所述的裝置,其特徵在於,所述排序模塊,具體用於: 基於詞典對所述第一排序結果進行過濾,獲得所述排序結果;或者 基於第二特徵對所述第一排序結果進行二次排序,獲得所述排序結果,其中,所述第二 特徵包括所述候選答案與所述答案類型的匹配度、所述候選答案與所述查詢信息的共現度 和所述候選答案在所述網頁文檔中出現的次數中的一種或多種;或者 將所述候選答案代入所述查詢信息進行二次檢索,根據檢索結果生成所述排序結果。
17. 根據權利要求15或16所述的裝置,其特徵在於,所述獲得模塊,具體用於: 根據所述問題的答案個數從所述排序結果中選擇對應數量的答案,並向所述客戶端返 回所述答案及其對應的網頁文檔。
18. -種信息推薦裝置,其特徵在於,包括: 處理模塊,用於接收查詢信息,並向搜尋引擎發送所述查詢信息,以使搜尋引擎對所述 查詢信息進行識別,獲得識別結果,並對根據所述查詢信息獲得的資源進行排序處理,獲得 排序結果,然後根據所述識別結果和所述排序結果獲得答案,並返回所述答案;以及 顯示模塊,用於接收來自所述搜尋引擎的答案,並在提供的搜索結果頁上顯示所述答 案。
19. 根據權利要求18所述的裝置,其特徵在於,所述顯示模塊,還用於: 在所述接收來自所述搜尋引擎的答案時,接收與所述答案對應的網頁文檔,並在所述 搜索結果頁上顯示提供所述答案的文檔的詳情信息。
20. 根據權利要求18或19所述的裝置,其特徵在於,所述顯示模塊,具體用於: 當所述答案的個數不確定時,在所述搜索結果頁上顯示預定數量的答案和用於展開顯 示剩餘答案的擴展按鍵;或者 當所述答案的個數為一個時,在所述搜索結果頁上顯示所述答案及其相關的連結信 息;或者 當所述答案的個數為預定數量時,在所述搜索結果頁上顯示所述預定數量的答案的鏈 接信息。
【文檔編號】G06F17/30GK104102721SQ201410345339
【公開日】2014年10月15日 申請日期:2014年7月18日 優先權日:2014年7月18日
【發明者】李國華, 劉濤, 孫興武, 張偉萌, 李超, 李興建, 廖夢, 韋豪傑, 張希娟, 忻舟, 馬豔軍 申請人:百度在線網絡技術(北京)有限公司