新四季網

一種社會化的搜尋引擎方法和系統的製作方法

2023-08-04 21:30:21 1

專利名稱:一種社會化的搜尋引擎方法和系統的製作方法
技術領域:
本發明涉及網際網路信息處理領域中的搜尋引擎技術,具體為一種社會化的搜尋引擎方法和系統。
背景技術:
搜尋引擎作為網際網路信息檢索的重要工具,極大地節省了用戶獲取信息的時間和精力。然而,隨著網絡的普及,存在於網絡資源池中的數據呈指數型增長,搜尋引擎已經越來越難以滿足用戶的搜索需求。特別是Web2. O的出現與發展,更多地考慮了人的因素,充分發揮了人的互動性,更促使網際網路成為了一個人們可以將自己隱性知識轉化流通、可共享顯性知識的互動平臺。因而,網際網路中的信息資源也不再僅僅依靠網站管理人員建立和維護,普通用戶成為信息的締造者和使用者,改變了以往用戶信息獲取的推送模式,呈現出去中心化的含義。目前,隨著社交網站、個人主頁、博客、微博、視頻和圖片分享等網絡應用的快速發展,極大地體現了人們對互動性的渴求。特別是微博的興起,以一條簡短的狀態信息來反映用戶自身最新的狀況,改變了長久以來始終以網頁作為信息獲取基本單元的模式,用戶希望通過參與、交流,獲取個性化、可信任的信息。然而這種對互動性的訴求是目前搜尋引擎通過在搜索框中鍵入關鍵字進行匹配所難以滿足的。同時,在網際網路海量信息面前,以Google、百度為代表的機器搜索依然強調算法,試圖用不斷提高的機器性能和不斷改進的算法技術來提升用戶的搜索體驗,已漸漸顯得力不從心,無論是精準度還是效率都不能滿足人的需要。近年來,百度貼吧、搜狗愛問等問答系統的出現雖然在一定程度上滿足了人們對互動性的要求,但是由於其答題者常常未經篩選,也未能發揮提問者的主觀判斷性,往往導致大量垃圾信息的出現。

發明內容
針對以上問題,本發明基於微博平臺,提供了一種社會化的搜尋引擎方法,來幫助用戶獲取準確、可信任的信息,從而提高搜尋引擎的查全率和查準率。為了達到上述目的,本發明採用了以下技術方案一種社會化的搜尋引擎方法,包括以下步驟( I)基於微博,建立專家信息庫;(2)獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家;(3)將用戶的查詢請求發送給一個或多個專家;(4)用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果;(5)對步驟(4)中返回的結果進行處理,並返回給用戶。所述的搜尋引擎方法,其特徵是,所述步驟(I)包括以下步驟(I. I)爬取微博網站上的網頁,抽取其中微博用戶的基本信息;(I. 2)提取微博用戶的微博關鍵詞;
(1.3)計算微博用戶的綜合影響力。所述的搜尋引擎方法,其特徵是,步驟(I. I)所述微博用戶的基本信息包括微博用戶名、微博帳號、所在地、聯繫郵箱、用戶標籤、用戶簡介、關注數、粉絲數、微博數。所述的搜尋引擎方法,其特徵是,步驟(I. 2)中,若用戶標籤不為空,則將其作為該用戶的微博關鍵詞;否則,將從該用戶最新發表的M篇微博狀態中提取關鍵詞作為該用戶的微博關鍵詞,其中M為自定義值。所述的搜尋引擎方法,其特徵是,步驟(I. 3),即利用公式(I)計算微博用戶的綜合影響力Wu ^dlNfans+S2CPiNmm+^2Nsutai)(I)
權利要求
1.一種社會化的搜尋引擎方法,包括以下步驟 (1)基於微博,建立專家信息庫; (2)獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家; (3)將用戶的查詢請求發送給一個或多個專家; (4)用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果; (5)對步驟(4)中返回的結果進行處理,並返回給用戶。
2.如權利要求I所述的搜尋引擎方法,其特徵是,所述步驟(I)包括以下步驟 (I. I)爬取微博網站上的網頁,抽取其中微博用戶的基本信息; (I. 2)提取微博用戶的微博關鍵詞; (I. 3)計算微博用戶的綜合影響力。
3.如權利要求2所述的搜尋引擎方法,其特徵是,步驟(I.I)所述微博用戶的基本信息包括微博用戶名、微博帳號、所在地、聯繫郵箱、用戶標籤、用戶簡介、關注數、粉絲數、微博數。
4.如權利要求3所述的搜尋引擎方法,其特徵是,步驟(I.2)中,若用戶標籤不為空,則將其作為該用戶的微博關鍵詞;否則,將從該用戶最新發表的M篇微博狀態中提取關鍵詞作為該用戶的微博關鍵詞,其中M為自定義值。
5.如權利要求2所述的搜尋引擎方法,其特徵是,步驟(I.3),即利用公式(I)計算微博用戶的綜合影響力 K+S2Cp1^tten+P2^statlls)(I) —W戶粉絲數α) 1 —專家庫中用戶粉絲數最大值Ν =用戶關注數(ffl) —專家庫中用戶關注數最大值Ar —用戶微博數,、α —專家庫中用戶微博數最大值' 其中Wu表示微博用戶u的綜合影響力,Nfans、Nattra^P Nstatus分別表示微博用戶u的粉絲數佔有率、關注數佔有率和微博數佔有率,4、β i為權重因子。
6.如權利要求I至5之一所述的搜尋引擎方法,其特徵是,步驟(2)包括以下步驟 (2. I)獲取用戶查詢請求; (2. 2)對獲取的用戶查詢請求進行分詞、關鍵詞提取,從而得到用戶查詢關鍵詞; (2. 3)將用戶查詢關鍵詞與專家信息庫中微博用戶的微博關鍵詞進行匹配; (2. 4)將匹配成功的微博用戶按其綜合影響力進行排序後返回給用戶。
7.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(3)包括以下步驟 (3. I)用戶自主選擇由步驟(2)得到的與查詢相關的專家列表,若用戶未自主選擇,則自動為用戶選擇排名前η位的專家,η為自定義值; (3. 2)轉發,以電子郵件或評論的形式向步驟(3. I)中所選專家轉發用戶查詢請求。
8.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(4)包括以下步驟(4. I)用戶請求轉發後,對此請求進行實時追蹤; (4. 2)及時抓取專家返回的結果。
9.如權利要求I所述的搜尋引擎方法,其特徵是,步驟(5)包括以下步驟 (5. I)計算結果得分,利用公式(V)計算步驟(4)返回的各條結果
10.一種社會化的搜尋引擎系統,包括信息爬取模塊、信息抽取模塊、專家資料庫、查詢請求處理模塊,其特徵是, 所述信息爬取模塊,用於爬取微博網站上的微博用戶信息; 所述信息抽取模塊,用於把爬取道德微博用戶信息進行抽取、組織,然後把組織好的微博用戶信息保存到專家資料庫中; 所述查詢請求處理模塊,用於接收用戶查詢請求;把該查詢請求和專家資料庫中的專家進行匹配;把匹配到的專家返回給用戶,預設選定η個專家,用戶可以自行更改選中的專家;把用戶請求發送給選中的專家;跟蹤專家反饋,把反饋信息展現給用戶。
全文摘要
一種社會化的搜尋引擎方法,首先基於微博,抽取微博用戶的基本信息,建立專家信息庫,然後獲取用戶查詢請求,根據查詢請求在專家信息庫中找到與之相關的專家,接著依據用戶自主選擇,將用戶的查詢請求轉發給一個或多個被選專家,進而,在用戶請求轉發後,對此請求進行實時追蹤,及時抓取專家返回的結果,最後對查詢結果進行處理,並返回給用戶。此方法更多的考慮了人的因素,通過幫助用戶找到與查詢最為相關的專家,在充分發揮用戶主觀判斷能力下,實現人到人的信息獲取模式,從而提高搜尋引擎的查全率和查準率。
文檔編號G06F17/30GK102930029SQ20121044118
公開日2013年2月13日 申請日期2012年11月7日 優先權日2012年11月7日
發明者王愷, 莫倩, 張樹, 張傳文, 李陽 申請人:北京網智天元科技有限公司, 北京工商大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀