新四季網

一種問題推送方法及系統的製作方法

2023-06-12 04:30:01 2

專利名稱:一種問題推送方法及系統的製作方法
一種問題推送方法及系統
技術領域:
本發明涉及網際網路技術領域,特別涉及一種問題推送方法及系統。
背景技術:
隨著網際網路技術的迅速發展,通過網際網路獲取信息以及進行相互通訊已經成為人們每天生活的一部分。知識問答系統就是一種利用通訊功能實現信息獲取的系統,用戶可以通過網頁在知識問答系統提交各種問題,查詢所提交問題的狀態,根據問題回答的狀況決定採用哪個答案。其他用戶可以通過訪問該網頁查看問題,並根據自己的喜好和知識進行回答。在目前的知識問答系統中,問題一旦在知識問答系統中提交,並以提問頁面的形式展現,就依靠在該知識問答系統上看到該提問頁面的其他用戶進行回答。然而,這種方式會造成以下問題其一、需要其他用戶登陸知識問答系統後,瀏覽到該提問頁面才可能會對提問頁面上的問題進行回答。其二、瀏覽到該提問頁面的用戶可能並沒有回答該問題的興趣或能力,就不會對提問頁面上的問題進行回答,或者,提供的回答可能不是優質答案。可以看出,現有知識問答系統中為提問用戶提供答案的效率和質量較低。

發明內容有鑑於此,本發明提供了一種問題推送的方法及系統,以便於提高知識問答系統提供答案的效率和質量。具體技術方案如下一種問題推送方法,基於預先建立的用戶模型,其中所述用戶模型包括以下所列中的至少兩個通過對用戶提問的問題和回答進行挖掘建立的興趣模型、基於用戶屬性建立的屬性模型、通過對用戶行為進行統計建立的行為模型以及基於不同用戶之間關係建立的關係模型;該方法包括A、對待回答問題進行文本分析提取問題特徵;B、利用提取的問題特徵匹配用戶模型,根據問題特徵在各用戶模型中與用戶的匹配程度以及預設的各用戶模型的排序權重,對用戶進行排序;C、將所述待回答問題推送給排序在前M個的用戶,其中M為預設的正整數。其中,所述興趣模型的建立包括SI、抓取各用戶的問答歷史數據;S2、對所述各用戶的問答歷史數據進行文本分析,抽取各用戶的興趣詞;S3、利用抽取的興趣詞建立或更新各用戶的興趣模型,其中興趣模型中包含用戶的興趣詞以及興趣詞在對應用戶的興趣模型中的權重FeatW。具體地,步驟S2可以包括分別針對每一用戶分別執行步驟S21至步驟S23 ;
S21、對該用戶回答的問題、提出的問題、瀏覽的問題或查詢的問題進行基於語義的分詞處理;S22、基於對分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ;S23、將表意權重值TermW大於預設的興趣選取權重值的詞語確定為該用戶的興趣詞。另外,所述步驟A具體包括Al、對所述待回答問題進行基於語義的分詞處理;A2、基於對分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ; A3、將表意權重值TermW大於預設的特徵提取權重值的詞語確定為所述待回答問題的特徵詞。其中,所述各詞語的表意權重值TermW為Termff = Termff = a*idf+b*ind,其中,倒文檔率idf=log(~^--he),c 為預設的大
df + 1
於或等於I的參數,df為詞語在所有待回答問題中出現的次數,N為待回答問題的數量,ind標識詞語的表意能力,a和b為預設的權重係數。更進一步地,在所述步驟S22之前,還包括將分詞處理後得到的各詞語中,df不在預設範圍內的詞語進行過濾,其中df為詞語在所有待回答問題中出現的次數;所述步驟S22中,僅針對df在預設範圍內的詞語計算表意權重值。所述興趣詞在對應用戶的興趣模型中的權重FeatW為FeatW = al*TermW+bl* Δ Tr,其中,Δ Tr為當前時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次相對於上一時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次的變化值或變化率,al和bl為預設的權重係數。具體地,按照0'=唚+ ΣΑ)-Κ^- ΣΑ)更新用戶的興趣模型,其中,Q'
iVr Di^Drn Dj^Dn
表示更新後的興趣模型,Q表示更新前的興趣模型,W表示正例樣本集合,包括在該用戶的問答歷史數據中出現頻次呈上升趨勢的興趣詞及其在興趣模型中的權重值,Nr表示正例樣本數量,Dn表示反例樣本集合,包括在該用戶的問答歷史數據中出現頻次呈下降趨勢的興趣詞及其在興趣模型中的權重值,Nn表示反例樣本數量,α、β和Y是預先設定的調整係數。較優地,該方法還包括對用戶的興趣模型中的興趣詞進行擴展;其中,針對用戶U的興趣模型中興趣詞Ti進行的擴展包括Dl、確定所述興趣詞Ti的擴展詞Tj ;D2、計算用戶u對所述擴展詞L的感興趣程度W」,Wj = a\ *\og(jnum) + Pujj + β\ * Wavg,
所述
權利要求
1.一種問題推送方法,其特徵在於,基於預先建立的用戶模型,其中所述用戶模型包括以下所列中的至少兩個通過對用戶提問的問題和回答進行挖掘建立的興趣模型、基於用戶屬性建立的屬性模型、通過對用戶行為進行統計建立的行為模型以及基於不同用戶之間關係建立的關係模型;該方法包括 A、對待回答問題進行文本分析提取問題特徵; B、利用提取的問題特徵匹配用戶模型,根據問題特徵在各用戶模型中與用戶的匹配程度以及預設的各用戶模型的排序權重,對用戶進行排序; C、將所述待回答問題推送給排序在前M個的用戶,其中M為預設的正整數。
2.根據權利要求I所述的方法,其特徵在於,所述興趣模型的建立包括 51、抓取各用戶的問答歷史數據; 52、對所述各用戶的問答歷史數據進行文本分析,抽取各用戶的興趣詞; 53、利用抽取的興趣詞建立或更新各用戶的興趣模型,其中興趣模型中包含用戶的興趣詞以及興趣詞在對應用戶的興趣模型中的權重FeatW。
3.根據權利要求2所述的方法,其特徵在於,步驟S2具體包括分別針對每一用戶分別執行步驟S21至步驟S23 ; 521、對該用戶回答的問題、提出的問題、瀏覽的問題或查詢的問題進行基於語義的分詞處理; 522、基於對分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ; 523、將表意權重值TermW大於預設的興趣選取權重值的詞語確定為該用戶的興趣詞。
4.根據權利要求I所述的方法,其特徵在於,所述步驟A具體包括 Al、對所述待回答問題進行基於語義的分詞處理; A2、基於對分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ; A3、將表意權重值TermW大於預設的特徵提取權重值的詞語確定為所述待回答問題的特徵詞。
5.根據權利要求3或4所述的方法,其特徵在於,所述各詞語的表意權重值TermW為 Termff = Termff = a*idf+b*ind,其中,倒文檔率idf=log(~^—+C), c 為預設的大於或 df + 1等於I的參數,df為詞語在所有待回答問題中出現的次數,N為待回答問題的數量,ind標識詞語的表意能力,a和b為預設的權重係數。
6.根據權利要求3所述的方法,其特徵在於,在所述步驟S22之前,還包括 將分詞處理後得到的各詞語中,df不在預設範圍內的詞語進行過濾,其中df為詞語在所有待回答問題中出現的次數; 所述步驟S22中,僅針對df在預設範圍內的詞語計算表意權重值。
7.根據權利要求3所述的方法,其特徵在於,所述興趣詞在對應用戶的興趣模型中的權重FeatW為 Featff = 31*161'1111+131*八1'1',其中,ATr為當前時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次相對於上一時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次的變化值或變化率,al和bl為預設的權重係數。
8.根據權利要求2所述的方法,其特徵在於, 按照2'=⑷+ / (+ ZA)更新用戶的興趣模型,其中,Q'表示更新後
9.根據權利要求2所述的方法,其特徵在於,該方法還包括對用戶的興趣模型中的興趣詞進行擴展; 其中,針對用戶u的興趣模型中興趣詞Ti進行的擴展包括 Dl、確定所述興趣詞Ti的擴展詞Tj ; D2、計算用戶u對所述擴展詞L的感興趣程度Wj,
10.根據權利要求9所述的方法,其特徵在於,所述步驟Dl具體包括 從具有所述興趣詞Ti的其他用戶的興趣模型中,選擇其他用戶的興趣模型中與所述興趣詞Ti屬於同一興趣分類中的其他興趣詞; 根據選擇的所述其他興趣詞與所述興趣詞Ti的相關度,選擇相關度排在前P個的興趣詞作為興趣詞Ti的擴展詞,其中P為預設的正整數。
11.根據權利要求I所述的方法,其特徵在於,所述屬性模型包括用戶屬性及用戶屬性在屬性模型中的權重值; 其中,所述用戶屬性包括以下所列中的一種或任意組合地理位置、性別、年齡以及行業; 將用戶具有的用戶屬性在屬性模型中的權重值設置為一個固定值,將用戶不具有的用戶屬性在屬性模型中的權重值設置為0 ;或者,將用戶的興趣模型中權重值最高的具有地理位置屬性的興趣詞作為該用戶的地理位置屬性添加到該用戶的屬性模型中,且該地理位置屬性在屬性模型中的權重值與興趣詞在該用戶的興趣模型中的權重值相同。
12.根據權利要求I所述的方法,其特徵在於,所述不同用戶之間關係包括以下所列的一種或任意組合問答關係、同團關係、相似興趣關係; 其中,所述同團關係包括出現在同一個社區、同一個欄目、同一個交流群或者回復同一個帖子。
13.根據權利要求11所述的方法,其特徵在於,如果關係模型中不同用戶之間關係僅包括問答關係或同團關係,則用戶ul和用戶u2之間的關係權重Rela Rankl (ul, u2)為Rela Rankl (ul, u2) = log(relaCnt+a 2)/logP 2 ;其中,a 2 和 P 2 為預設的平滑係數,relaCnt為用戶ul和u2在設定時間段內問答關係或同團關係出現的次數; 如果關係模型中不同用戶之間關係僅包括相似興趣關係,則用戶ul和用戶u2之間的關係權重Rela Rank2(ul,u2)為RelaRank2(ul,u2)= 21 2,其中,為用戶 ul
14.根據權利要求I所述的方法,其特徵在於,所述行為模型包括用戶的活躍度等級;其中用戶u的活躍度等級Active(U)為Active(u) = [log (Sanswer+a 4) *wl+log (Slogin+a 4) *w2+log (Sbrowse+a 4)*w3]/log3 4,wl、w2和w3是預設的權重係數,a 4和0 4為預設的平滑係數, S 、Sltjgin和S—分別為用戶u在設定時間段內回答問題的次數、登陸問答系統的次數、和瀏覽問答系統頁面的次數,或者分別為用戶u在設定時間段內回答問題的頻率、登陸問答系統的頻率、瀏覽問答系統頁面的頻率。
15.根據權利要求I所述的方法,其特徵在於,所述步驟B具體包括 BI、利用提取的問題特徵匹配興趣模型、屬性模型和關係模型中的一種或任意組合,確定與所述提取的問題特徵匹配的用戶; B2、利用興趣模型、屬性模型、關係模型和行為模型中的一種或任意組合,確定步驟BI確定出的用戶與所述待回答問題的匹配程度,根據匹配程度對所述步驟BI確定出的用戶進行排序; 其中,所述步驟BI利用的用戶模型與步驟B2利用的用戶模型不完全相同。
16.根據權利要求15所述的方法,其特徵在於,如果所述步驟BI中利用的用戶模型為兩個以上,則將分別利用各用戶模型確定出的與所述提取的問題特徵匹配的用戶取併集。
17.根據權利要求15或16所述的方法,其特徵在於,如果所述步驟BI中利用了興趣模型,則所述提取的問題特徵包括所述待回答問題的特徵詞; 利用興趣模型確定與所述提取的問題特徵匹配的用戶包括 將所述特徵詞與各用戶的興趣模型進行匹配,將所述特徵詞所命中興趣詞對應的用戶確定為與所述提取的問題特徵匹配的用戶; 或者,將所述特徵詞與各用戶的興趣模型進行匹配,確定所述特徵詞所命中興趣詞對應的用戶以及所命中興趣詞在興趣1吳型中的權重值,將所命中興趣詞在興趣1吳型中權重值大於預設匹配權重值的用戶確定為匹配的用戶。
18.根據權利要求17所述的方法,其特徵在於,該方法還包括確定所述待回答問題所屬的興趣分類,將該興趣分類的權重值小於預設的興趣過濾權重值的用戶從所述匹配的用戶中過濾掉。
19.根據權利要求15或16所述的方法,其特徵在於,如果所述步驟BI中利用了屬性模型,則所述提取的問題特徵包括所述待回答問題的特徵詞; 利用屬性模型確定與所述提取的問題特徵匹配的用戶包括 將所述特徵詞與各用戶的屬性模型進行匹配,將與所述特徵詞之間的相關度達到預設相關度要求的用戶屬性所對應的用戶確定為與所述提取的問題特徵匹配的用戶。
20.根據權利要求15或16所述的方法,其特徵在於,如果所述步驟BI中利用了關係模型,則所述提取的問題特徵包括所述待回答問題的提問用戶信息; 利用關係模型確定與所述提取的問題特徵匹配的用戶包括 將所述提問用戶信息與關係模型進行匹配,將與所述提問用戶之間的關係權重值達到預設匹配權重值的用戶確定為與所述提取的問題特徵匹配的用戶。
21.根據權利要求15所述的方法,其特徵在於,用戶U與所述待回答問題的匹配程度Rank(U)為Rank(U) = Rank(interest)*ffl+Rank(Profile)*W2+Rank(rela)*W3+Rank(behavior)*W4 ; 其中,Wl、W2、W3 和 W4 為預設的權重係數,*FeatWl 』 Tn 為從所述待回答問題中提取的特徵詞集合,TermWi為第i個特徵詞的表意權重值,FeatWi為第i個特徵詞在用戶U的興趣模型中的權重值,Rank(Proflle)= Zlermw1 ^FeaVec1 』 FeaV IGTn為第i個特徵詞在用戶U的屬性模型中的權重值,Rank (rela)為在所述關係模型中查找的所述待回答問題的提問用戶與所述用戶U之間的關係權重值,Rank(behavior)由在所述用戶U的行為模型中查找的所述用戶U的活躍等級Active(U)確定。
22.根據權利要求I所述的方法,其特徵在於,所述步驟C包括 根據所述步驟B的排序結果,將所述待回答問題推送給排在前M個的用戶中處於在線狀態的用戶。
23.根據權利要求14所述的方法,其特徵在於,所述步驟C包括 根據所述步驟B的排序結果,將所述待回答問題推送給排在前M個的用戶中活躍度等級超過預設的推送活躍度的用戶。
24.一種問題推送系統,其特徵在於,該系統基於預先建立的用戶模型,其中所述用戶模型包括以下所列中的至少兩個通過對用戶提問的問題和回答進行挖掘建立的興趣模型、基於用戶屬性建立的屬性模型、通過對用戶行為進行統計建立的行為模型以及基於不同用戶之間關係建立的關係模型;該系統包括特徵提取單元、用戶排序單元和問題推送單元; 所述特徵提取單元,用於對待回答問題進行文本分析提取問題特徵; 所述用戶排序單元,用於利用所述特徵提取單元提取的問題特徵匹配用戶模型,根據問題特徵在各用戶模型中與用戶的匹配程度以及預設的各用戶模型的排序權重,對用戶進行排序; 所述問題推送單元,用於根據所述用戶排序單元的排序結果,將所述待回答問題推送給排序在前M個的用戶,其中M為預設的正整數。
25.根據權利要求24所述的系統,其特徵在於,該系統還包括興趣模型維護單元;所述興趣模型維護單元具體包括數據抓取子單元、文本分析子單元和模型維護子單元; 所述數據抓取子單元,用於抓取各用戶的問答歷史數據; 所述文本分析子單元,用於對所述各用戶的問答歷史數據進行文本分析,抽取各用戶的興趣詞; 所述模型維護子單元,用於利用所述文本分析子單元抽取的興趣詞建立或更新各用戶的興趣模型,其中興趣模型中包含用戶的興趣詞以及興趣詞在對應用戶的興趣模型中的權重FeatW。
26.根據權利要求25所述的系統,其特徵在於,所述文本分析子單元具體包括分詞處理模塊、權重確定模塊和興趣詞確定模塊; 所述分詞處理模塊,用於對用戶回答的問題、提出的問題、瀏覽的問題或查詢的問題進行基於語義的分詞處理; 所述權重確定模塊,用於基於所述分詞處理模塊分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ; 所述興趣詞確定模塊,用於將表意權重值TermW大於預設的興趣選取權重值的詞語確定為該用戶的興趣詞。
27.根據權利要求24所述的系統,其特徵在於,所述特徵提取單元具體包括分詞處理子單元、權重確定子單元和興趣詞確定子單元; 所述分詞處理子單元,用於對所述待回答問題進行基於語義的分詞處理; 所述權重確定子單元,用於基於對所述分詞處理子單元分詞處理後得到的各詞語的倒文檔率以及表意能力,確定所述各詞語的表意權重值TermW ; 所述興趣詞確定子單元,用於將表意權重值TermW大於預設的特徵提取權重值的詞語確定為所述待回答問題的特徵詞。
28.根據權利要求26或27所述的系統,其特徵在於,所述各詞語的表意權重值TermW為 Termff = Termff = a*idf+b*ind,其中,倒文檔率
29.根據權利要求26所述的系統,其特徵在於,所述文本分析子單元還包括過濾處理模塊,用於將所述分詞處理模塊分詞處理後得到的各詞語中,df不在預設範圍內的詞語進行過濾,其中df為詞語在所有待回答問題中出現的次數; 所述權重確定模塊僅針對所述過濾處理模塊過濾後得到的詞語計算表意權重值。
30.根據權利要求26所述的系統,其特徵在於,所述興趣詞在對應用戶的興趣模型中的權重FeatW為 Featff = 31*161'1111+131*八1'1',其中,ATr為當前時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次相對於上一時間段抓取的用戶問答歷史數據中該興趣詞出現的頻次的變化值或變化率,al和bl為預設的權重係數。
31.根據權利要求25所述的系統,其特徵在於,所述模型維護子單元按照
32.根據權利要求25所述的系統,其特徵在於,興趣模型維護單元還包括興趣詞擴展子單元,用於對用戶的興趣模型中的興趣詞進行擴展; 所述興趣詞擴展子單元具體包括擴展詞確定模塊、興趣度計算模塊和興趣詞擴展模塊; 所述擴展詞確定模塊,用於確定興趣詞Ti的擴展詞Tj ; 所述興趣度計算模塊,用於計算用戶u對所述擴展詞L的感興趣程度%,其中,
33.根據權利要求32所述的系統,其特徵在於,所述擴展詞確定模塊具體從具有所述興趣詞Ti的其他用戶的興趣模型中,選擇其他用戶的興趣模型中與所述興趣詞Ti屬於同一興趣分類中的其他興趣詞,根據選擇的所述其他興趣詞與所述興趣詞Ti的相關度,選擇相關度排在前P個的興趣詞作為興趣詞Ti的擴展詞,其中P為預設的正整數。
34.根據權利要求24所述的系統,其特徵在於,該系統還包括屬性模型維護單元,用於基於用戶屬性建立和更新用戶的屬性模型; 所述屬性模型包括用戶屬性及用戶屬性在屬性模型中的權重值; 其中,所述用戶屬性包括以下所列中的一種或任意組合地理位置、性別、年齡以及行業; 所述屬性模型維護單元將用戶具有的用戶屬性在屬性模型中的權重值設置為一個固定值,將用戶不具有的用戶屬性在屬性模型中的權重值設置為O ;或者,將用戶的興趣模型中權重值最高的具有地理位置屬性的興趣詞作為該用戶的地理位置屬性添加到該用戶的屬性模型中,且該地理位置屬性在屬性模型中的權重值與興趣詞在該用戶的興趣模型中的權重值相同。
35.根據權利要求24所述的系統,其特徵在於,該系統還包括關係模型維護單元,用於基於不同用戶之間關係,建立和更新關係模型; 所述不同用戶之間關係包括以下所列的一種或任意組合問答關係、同團關係以及相似興趣關係;其中,所述同團關係包括出現在同一個社區、同一個欄目、同一個交流群或者回復同一個帖子。
36.根據權利要求35所述的系統,其特徵在於,如果關係模型中不同用戶之間關係僅包括問答關係或同團關係,則用戶ul和用戶u2之間的關係權重Rela Rankl (ul, u2)為Rela Rankl (ul, u2) = log (relaCnt+a 2)/log P 2 ;其中,a 2 和 P 2 為預設的平滑係數,relaCnt為用戶ul和u2在設定時間段內問答關係或同團關係出現的次數; 如果關係模型中不同用戶之間關係僅包括相似興趣關係,則用戶ul和用戶u2之間的關係權重 Rela Rank2(ul,u2)為RelaRank2(ul,u2)= 21 2,其中,為用戶 ul
37.根據權利要求24所述的系統,其特徵在於,該系統還包括行為模型維護單元,用於對用戶行為進行統計,建立和更新用戶的行為模型; 其中,所述行為模型包括用戶的活躍度等級;其中用戶u的活躍度等級Active (U)為 Active(u) = [log (Sanswer+a 4) *wl+log (Slogin+a 4) *w2+log (Sbrowse+a 4)*w3]/log3 4, wl、w2和w3是預設的權重係數,a 4和0 4為預設的平滑係數, S 、Sltjgin和S—分別為用戶u在設定時間段內回答問題的次數、登陸問答系統的次數、和瀏覽問答系統頁面的次數,或者分別為用戶u在設定時間段內回答問題的頻率、登陸問答系統的頻率、瀏覽問答系統頁面的頻率。
38.根據權利要求24所述的系統,其特徵在於,所述用戶排序單元具體包括用戶匹配子單元和用戶排序子單元; 所述用戶匹配子單元,用於利用所述特徵提取單元提取的問題特徵匹配興趣模型、屬性模型和關係模型中的一種或任意組合,確定與所述提取的問題特徵匹配的用戶; 所述用戶排序子單元,用於利用興趣模型、屬性模型、關係模型和行為模型中的一種或任意組合,確定所述用戶匹配子單元確定出的用戶與所述待回答問題的匹配程度,根據匹配程度對所述用戶匹配子單元確定出的用戶進行排序; 其中,所述用戶匹配子單元利用的用戶模型與所述用戶排序子單元利用的用戶模型不完全相同。
39.根據權利要求38所述的系統,其特徵在於,所述用戶匹配子單元如果利用的用戶模型為兩個以上,則還用於將利用各用戶模型確定出的與所述提取的問題特徵匹配的用戶取併集。
40.根據權利要求38或39所述的系統,其特徵在於,如果所述用戶匹配子單元利用了興趣模型,則所述提取的問題特徵包括所述待回答問題的特徵詞; 所述用戶匹配子單元將所述特徵詞與各用戶的興趣模型進行匹配,將所述特徵詞所命中興趣詞對應的用戶確定為與所述提取的問題特徵匹配的用戶;或者,將所述特徵詞與各用戶的興趣模型進行匹配,確定所述特徵詞所命中興趣詞對應的用戶以及所命中興趣詞在興趣模型中的權重值,將所命中興趣詞在興趣模型中權重值大於預設匹配權重值的用戶確定為匹配的用戶。
41.根據權利要求40所述的系統,其特徵在於,所述用戶排序單元還包括用戶過濾子單元,用於確定所述待回答問題所屬的興趣分類,將該興趣分類的權重值小於預設的興趣過濾權重值的用戶從所述用戶匹配子單元確定出的用戶中過濾掉。
42.根據權利要求38或39所述的系統,其特徵在於,如果所述用戶匹配子單元利用了屬性模型,則所述提取的問題特徵包括所述待回答問題的特徵詞; 所述用戶匹配子單元將所述特徵詞與各用戶的屬性模型進行匹配,將與所述特徵詞之間的相關度達到預設相關度要求的用戶屬性所對應的用戶確定為與所述提取的問題特徵匹配的用戶。
43.根據權利要求38或39所述的系統,其特徵在於,如果所述用戶匹配子單元利用了關係模型,則所述提取的問題特徵包括所述待回答問題的提問用戶信息; 所述用戶匹配子單元將所述提問用戶信息與關係模型進行匹配,將與所述提問用戶之間的關係權重值達到預設匹配權重值的用戶確定為與所述提取的問題特徵匹配的用戶。
44.根據權利要求38所述的系統,其特徵在於,所述用戶排序子單元採用如下公式確定用戶U與所述待回答問題的匹配程度Rank(U) Rank (U) = Rank (interest) *ffl+Rank (Profile)*W2+Rank(rela)*W3+Rank(behavior)*W4 ; 其中,Wl、W2、W3 和W4 為預設的權重係數,
45.根據權利要求24所述的系統,其特徵在於,所述問題推送單元具體包括狀態確定子單元和第一推送子單元; 所述狀態確定子單元,用於根據所述用戶排序單元的排序結果,確定排在前M個的用戶是否處於在線狀態; 所述第一推送子單元,用於將所述待回答問題推送給排在前M個的用戶中處於在線狀態的用戶。
46.根據權利要求37所述的系統,其特徵在於,所述問題推送單元具體包括活躍度確定子單元和第二推送子單元; 所述活躍度確定子單元,用於根據所述用戶排序單元的排序結果,從行為模型中查找排在前M個用戶的活躍度等級; 所述第二推送子單元,用於將所述待回答問題推送給排在前M個的用戶中活躍度等級超過預設的推送活躍度的用戶。
全文摘要
本發明提供了一種問題推送方法及系統,基於預先建立的用戶模型,其中所述用戶模型包括以下所列中的至少兩個通過對用戶提問的問題和回答進行挖掘建立的興趣模型、基於用戶屬性建立的屬性模型、通過對用戶行為進行統計建立的行為模型以及基於不同用戶之間關係建立的關係模型;其中方法包括A、對待回答問題進行文本分析提取問題特徵;B、利用提取的問題特徵匹配用戶模型,根據問題特徵在各用戶模型中與用戶的匹配程度以及預設的各用戶模型的排序權重,對用戶進行排序;C、將所述待回答問題推送給排序在前M個的用戶,其中M為預設的正整數。通過本發明能夠提高知識問答系統提供答案的效率和質量。
文檔編號G06F17/30GK102637170SQ201110035679
公開日2012年8月15日 申請日期2011年2月10日 優先權日2011年2月10日
發明者姜庭欣, 李連華, 羅建嵐, 謝雙賓 申請人:北京百度網訊科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀