新四季網

優化搜尋引擎的方法及裝置製造方法

2023-12-09 02:33:21 4

優化搜尋引擎的方法及裝置製造方法
【專利摘要】本發明提供一種優化搜尋引擎的方法及裝置,該方法包括:在接收到新的記錄時,從該記錄中提取時間信息,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索引信息添加到創建的索引表中;根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息;在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。本發明有效提升了搜索應用伺服器在交通行業的應用能力,滿足用戶對大數據量查詢的快速響應要求。
【專利說明】優化搜尋引擎的方法及裝置
【技術領域】
[0001]本發明涉及搜尋引擎【技術領域】,尤其涉及一種優化搜尋引擎的方法及裝置。
【背景技術】
[0002]隨著雲存儲資料庫在交通行業的廣泛應用,其在查詢功能上的不足也日益凸顯,為彌補雲存儲資料庫在數據查詢功能上的不足,往往通過引入搜索應用伺服器為雲存儲資料庫創建索引,提升查詢性能。搜索應用伺服器作為一種可伸縮的、致力於信息檢索的、可以處理海量信息的應用伺服器,在數據檢索方面具有得天獨厚的優勢,能很好的彌補雲存儲資料庫檢索的不足。
[0003]現有的索引創建和查詢的流程雖然能夠解決雲存儲資料庫查詢性能的不足,但由於為了保證檢索功能的通用性,導致性能瓶頸,當資料庫中的數據量達到億級或十億級時,其查詢響應時間往往在10秒左右,如需要排序,則時間消耗更是成倍數增長,無法滿足交通行業快速響應的需求。

【發明內容】

[0004]有鑑於此,本發明提供一種優化的搜尋引擎裝置,應用於搜索應用伺服器設備上,該裝置包括:
[0005]索引信息創建單元,用於在接收到新的記錄時,從該記錄中提取時間信息,根據預設的時間段劃分規則,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索弓I信息添加到創建的索引表中;
[0006]索引文件生成單元,用於根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息;
[0007]索引信息查詢單元,用於在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。
[0008]本發明還提供了一種優化搜尋引擎的方法,應用於搜索應用伺服器設備上,該方法包括:
[0009]步驟A,在接收到新的記錄時,從該記錄中提取時間信息,根據預設的時間段劃分規則,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索弓I信息添加到創建的索引表中;
[0010]步驟B,根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息;
[0011]步驟C,在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。
[0012]本發明有效提升了搜索應用伺服器在交通行業的應用能力,滿足用戶對大數據量查詢的快速響應要求。
【專利附圖】

【附圖說明】
[0013]圖1是本發明一種實施方式中索引裝置的邏輯結構及其基礎硬體環境的示意圖。
[0014]圖2是本發明一種實施方式中索引方法的流程圖。
【具體實施方式】
[0015]以下結合附圖對本發明進行詳細描述。
[0016]本發明提供一種優化搜尋引擎的裝置,應用於搜索應用伺服器設備上。以下以軟體實現為例進行說明,但是本發明並不排除諸如硬體或者邏輯器件等其他實現方式。如圖1所示,該裝置運行的硬體環境通常包括CPU、內存、非易失性存儲器以及其他硬體。該裝置作為一個邏輯層面的虛擬裝置,其通過CPU來運行。該裝置包括索引信息創建單元、索引文件生成單元以及索引信息查詢單元。請參考圖2具體的實施步驟。
[0017]步驟101,在接收到新的記錄時,從該記錄中提取時間信息,根據預設的時間段劃分規則,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索引信息添加到創建的索引表中;
[0018]步驟102,根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息;
[0019]步驟103,在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。
[0020]在常規的索引方法中,為了保證搜索應用伺服器的通用性,對索引記錄的時間信息不做特殊處理,導致在查詢時需要遍歷所有的索引文件,當索引文件過多時,其打開文件和加載數據的過程將消耗很多時間,且對所有索引記錄都需要進行條件過濾,極大地延長了查詢的響應時間。本發明針對交通行業中記錄數據必然包含時間信息,且用戶往往按照時間信息進行查詢的特點,通過引入時間信息優化搜索應用伺服器的索引處理流程。現以交通行業中經常查詢的過車記錄為例,詳細介紹搜索應用伺服器的索引處理流程。
[0021]搜索應用伺服器在接收到新的記錄時,從該記錄中提取時間信息,根據預先設置的時間段劃分規則,確認該記錄的時間信息屬於哪一個時間段,再查詢內存中是否存在該時間段對應的索引表,若不存在,則創建該時間段的索引表。例如,以月份來劃分時間段,則屬於同一個月份的記錄,其建立的索引表項將添加到同一個索引表中。所述索引表包括正排索引表和倒排索引表,正排索引表是根據記錄查找記錄中的信息,倒排索引表是根據信息查找包含該信息的記錄,後續具體例子將對此進行詳細說明。當搜索應用伺服器接收到一條新記錄時,提取記錄中的關鍵字信息,根據該記錄中的時間信息建立正排索引表項,其它信息建立倒排 索引表項,並存入對應的索引表中。例如:若過車記錄包含4個關鍵信息,具體為過車時間、過車卡口、車牌信息以及是否違章。以下以表1過車記錄為例進行說明。
[0022]
序號I記錄標識符I過車時間~I過車卡口I車牌信息~I是否違章
【權利要求】
1.一種優化搜尋引擎的裝置,應用於搜索應用伺服器設備上,其特徵在於,該裝置包括: 索引信息創建單元,用於在接收到新的記錄時,從該記錄中提取時間信息,根據預設的時間段劃分規則,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索引信息添加到創建的索引表中; 索引文件生成單元,用於根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息; 索引信息查詢單元,用於在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。
2.如權利要求1所述的裝置,其特徵在於: 所述索引文件的時間段信息包含在該索引文件的文件名中。
3.如權利要求1所述的裝置,其特徵在於: 所述索引文件生成單元進一步用於將同一時間段內的索引文件按照預設的合併策略進行索引文件合併。
4.如權利要求1所述的裝置,其特徵在於: 所述索引信息查詢單元進一步用於在所述滿足時間過濾條件的索引文件中,對具有相同時間段的索引文件分別統計滿足其它過濾條件的記錄總數,並根據排序要求,對滿足過濾條件的記錄進行排序並輸出,其中,所述排序要求包括排序方式、偏移條數以及顯示條數,所述排序方式為按照時間升序或降序排列,所述偏移條數為所述滿足過濾條件的記錄按照所述排序方式排序後,不需要輸出的前N條記錄。
5.如權利要求1所述的裝置,其特徵在於: 所述預設的時間段劃分規則可自適應調整時間段長度。
6.一種優化搜尋引擎的方法,應用於搜索應用伺服器設備上,其特徵在於,該方法包括: 步驟A,在接收到新的記錄時,從該記錄中提取時間信息,根據預設的時間段劃分規則,確認該時間信息所屬時間段,判斷是否存在該時間段的索引表,若不存在,則創建該時間段的索引表,並將所述記錄的索引信息添加到創建的索引表中; 步驟B,根據預設的索引文件生成規則,將所述索引表打包成對應的索引文件,所述索引文件包含所述時間段信息; 步驟C,在接收到查詢請求時,從該查詢請求中獲取時間過濾條件,解析所有索引文件的時間段信息,保留符合所述時間過濾條件的索引文件,遍歷所述保留的索引文件中的記錄,查詢滿足其它過濾條件的記錄並輸出。
7.如權利要求6所述的方法,其特徵在於: 所述索引文件的時間段信息包含在該索引文件的文件名中。
8.如權利要求6所述的方法,其特徵在於: 所述步驟B還包括:將同一時間段內的索引文件按照預設的合併策略進行索引文件合併。
9.如權利要求6所述的方法,其特徵在於:所述步驟C還包括:在所述滿足時間過濾條件的索引文件中,對具有相同時間段的索引文件分別統計滿足其它過濾條件的記錄總數,並根據排序要求,對滿足過濾條件的記錄進行排序並輸出,其中,所述排序要求包括排序方式、偏移條數以及顯示條數,所述排序方式為按照時間升序或降序排列,所述偏移條數為所述滿足過濾條件的記錄按照所述排序方式排序後,不需要輸出的前N條記錄。
10.如權利要求6所述的方法,其特徵在於: 所述預設的時 間段劃分規則可自適應調整時間段長度。
【文檔編號】G06F17/30GK103970853SQ201410186758
【公開日】2014年8月6日 申請日期:2014年5月5日 優先權日:2014年5月5日
【發明者】陶明淵 申請人:浙江宇視科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀