一種社會化的搜尋引擎方法和系統的製作方法
2023-08-04 21:30:21 1
專利名稱:一種社會化的搜尋引擎方法和系統的製作方法
技術領域:
本發明涉及網際網路信息處理領域中的搜尋引擎技術,具體為一種社會化的搜尋引擎方法和系統。
背景技術:
搜尋引擎作為網際網路信息檢索的重要工具,極大地節省了用戶獲取信息的時間和精力。然而,隨著網絡的普及,存在於網絡資源池中的數據呈指數型增長,搜尋引擎已經越來越難以滿足用戶的搜索需求。特別是Web2. O的出現與發展,更多地考慮了人的因素,充分發揮了人的互動性,更促使網際網路成為了一個人們可以將自己隱性知識轉化流通、可共享顯性知識的互動平臺。因而,網際網路中的信息資源也不再僅僅依靠網站管理人員建立和維護,普通用戶成為信息的締造者和使用者,改變了以往用戶信息獲取的推送模式,呈現出去中心化的含義。目前,隨著社交網站、個人主頁、博客、微博、視頻和圖片分享等網絡應用的快速發展,極大地體現了人們對互動性的渴求。特別是微博的興起,以一條簡短的狀態信息來反映用戶自身最新的狀況,改變了長久以來始終以網頁作為信息獲取基本單元的模式,用戶希望通過參與、交流,獲取個性化、可信任的信息。然而這種對互動性的訴求是目前搜尋引擎通過在搜索框中鍵入關鍵字進行匹配所難以滿足的。同時,在網際網路海量信息面前,以Google、百度為代表的機器搜索依然強調算法,試圖用不斷提高的機器性能和不斷改進的算法技術來提升用戶的搜索體驗,已漸漸顯得力不從心,無論是精準度還是效率都不能滿足人的需要。近年來,百度貼吧、搜狗愛問等問答系統的出現雖然在一定程度上滿足了人們對互動性的要求,但是由於其答題者常常未經篩選,也未能發揮提問者的主觀判斷性,往往導致大量垃圾信息的出現。
發明內容
針對以上問題,本發明基於微博平臺,提供了一種社會化的搜尋引擎方法,來幫助用戶獲取準確、可信任的信息,從而提高搜尋引擎的查全率和查準率。為了達到上述目的,本發明採用了以下技術方案一種社會化的搜尋引擎方法,包括以下步驟( I)基於微博,建立專家信息庫;(2)獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家;(3)將用戶的查詢請求發送給一個或多個專家;(4)用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果;(5)對步驟(4)中返回的結果進行處理,並返回給用戶。所述的搜尋引擎方法,其特徵是,所述步驟(I)包括以下步驟(I. I)爬取微博網站上的網頁,抽取其中微博用戶的基本信息;(I. 2)提取微博用戶的微博關鍵詞;
(1.3)計算微博用戶的綜合影響力。所述的搜尋引擎方法,其特徵是,步驟(I. I)所述微博用戶的基本信息包括微博用戶名、微博帳號、所在地、聯繫郵箱、用戶標籤、用戶簡介、關注數、粉絲數、微博數。所述的搜尋引擎方法,其特徵是,步驟(I. 2)中,若用戶標籤不為空,則將其作為該用戶的微博關鍵詞;否則,將從該用戶最新發表的M篇微博狀態中提取關鍵詞作為該用戶的微博關鍵詞,其中M為自定義值。所述的搜尋引擎方法,其特徵是,步驟(I. 3),即利用公式(I)計算微博用戶的綜合影響力Wu ^dlNfans+S2CPiNmm+^2Nsutai)(I)
權利要求
1.一種社會化的搜尋引擎方法,包括以下步驟 (1)基於微博,建立專家信息庫; (2)獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家; (3)將用戶的查詢請求發送給一個或多個專家; (4)用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果; (5)對步驟(4)中返回的結果進行處理,並返回給用戶。
2.如權利要求I所述的搜尋引擎方法,其特徵是,所述步驟(I)包括以下步驟 (I. I)爬取微博網站上的網頁,抽取其中微博用戶的基本信息; (I. 2)提取微博用戶的微博關鍵詞; (I. 3)計算微博用戶的綜合影響力。
3.如權利要求2所述的搜尋引擎方法,其特徵是,步驟(I.I)所述微博用戶的基本信息包括微博用戶名、微博帳號、所在地、聯繫郵箱、用戶標籤、用戶簡介、關注數、粉絲數、微博數。
4.如權利要求3所述的搜尋引擎方法,其特徵是,步驟(I.2)中,若用戶標籤不為空,則將其作為該用戶的微博關鍵詞;否則,將從該用戶最新發表的M篇微博狀態中提取關鍵詞作為該用戶的微博關鍵詞,其中M為自定義值。
5.如權利要求2所述的搜尋引擎方法,其特徵是,步驟(I.3),即利用公式(I)計算微博用戶的綜合影響力 K+S2Cp1^tten+P2^statlls)(I) —W戶粉絲數α) 1 —專家庫中用戶粉絲數最大值Ν =用戶關注數(ffl) —專家庫中用戶關注數最大值Ar —用戶微博數,、α —專家庫中用戶微博數最大值' 其中Wu表示微博用戶u的綜合影響力,Nfans、Nattra^P Nstatus分別表示微博用戶u的粉絲數佔有率、關注數佔有率和微博數佔有率,4、β i為權重因子。
6.如權利要求I至5之一所述的搜尋引擎方法,其特徵是,步驟(2)包括以下步驟 (2. I)獲取用戶查詢請求; (2. 2)對獲取的用戶查詢請求進行分詞、關鍵詞提取,從而得到用戶查詢關鍵詞; (2. 3)將用戶查詢關鍵詞與專家信息庫中微博用戶的微博關鍵詞進行匹配; (2. 4)將匹配成功的微博用戶按其綜合影響力進行排序後返回給用戶。
7.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(3)包括以下步驟 (3. I)用戶自主選擇由步驟(2)得到的與查詢相關的專家列表,若用戶未自主選擇,則自動為用戶選擇排名前η位的專家,η為自定義值; (3. 2)轉發,以電子郵件或評論的形式向步驟(3. I)中所選專家轉發用戶查詢請求。
8.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(4)包括以下步驟(4. I)用戶請求轉發後,對此請求進行實時追蹤; (4. 2)及時抓取專家返回的結果。
9.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(5)包括以下步驟 (5. I)計算結果得分,利用公式(V)計算步驟(4)返回的各條結果
10.一種社會化的搜尋引擎系統,包括信息爬取模塊、信息抽取模塊、專家資料庫、查詢請求處理模塊,其特徵是, 所述信息爬取模塊,用於爬取微博網站上的微博用戶信息; 所述信息抽取模塊,用於把爬取道德微博用戶信息進行抽取、組織,然後把組織好的微博用戶信息保存到專家資料庫中; 所述查詢請求處理模塊,用於接收用戶查詢請求;把該查詢請求和專家資料庫中的專家進行匹配;把匹配到的專家返回給用戶,預設選定η個專家,用戶可以自行更改選中的專家;把用戶請求發送給選中的專家;跟蹤專家反饋,把反饋信息展現給用戶。
全文摘要
一種社會化的搜尋引擎方法,首先基於微博,抽取微博用戶的基本信息,建立專家信息庫,然後獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家,接著依據用戶自主選擇,將用戶的查詢請求轉發給一個或多個被選專家,進而,在用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果,最後對查詢結果進行處理,並返回給用戶。此方法更多的考慮了人的因素,通過幫助用戶找到與查詢最為相關的專家,在充分發揮用戶主觀判斷能力下,實現人到人的信息獲取模式,從而提高搜尋引擎的查全率和查準率。
文檔編號G06F17/30GK102930029SQ20121044118
公開日2013年2月13日 申請日期2012年11月7日 優先權日2012年11月7日
發明者王愷, 莫倩, 張樹, 張傳文, 李陽 申請人:北京網智天元科技有限公司, 北京工商大學