新四季網

一種對等雲平臺上構建希爾伯特r樹索引的方法

2023-06-24 10:46:46 2

一種對等雲平臺上構建希爾伯特r樹索引的方法
【專利摘要】一種對等結構雲平臺上構建希爾伯特R樹索引的方法,在P2P雲平臺中的主節點組織成對等結構的Chord網絡。首先,通過映射方法讀取數據對象,基於其地理位置得到其所處空間的希爾伯特曲線編碼;其次,基於這一編碼對數據對象進行分區,並將其傳給相應的歸約方法;然後,歸約方法對各個分區的數據對象進行希爾伯特R子樹的構建;最後,通過安全散列函數得到希爾伯特R子樹根節點編號的散列值,並將其發布到處於Chord環中的主節點上,構成完整的分布式希爾伯特R樹索引。本方法能並行地建立希爾伯特R樹,減少了建樹的時間;同時,建立的希爾伯特R樹是分布式的,加強了索引的穩定性和查找效率。
【專利說明】—種對等雲平臺上構建希爾伯特R樹索引的方法
【技術領域】
[0001]本發明涉及一種對等雲平臺上構建希爾伯特R樹索引的方法,屬於空間數據索引和對等雲平臺的融合【技術領域】。
【背景技術】
[0002]雲計算是一種商業計算模型將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和信息服務。現在Google公司和開源雲計算平臺Hadoop等都使用Map-Reduce平行計算模型,該模型為海量數據的處理提供了一個通用、高效的技術框架,從而在地理空間數據查詢處理、數據挖掘等領域得到了越來越廣泛的應用。
[0003]P2P (Peer-to-Peer,對等網)計算是指不同系統之間通過直接交換,實現計算機資源和服務共享、進行信息處理的過程。這裡,資源可以是處理器、緩存和磁碟空間等;服務包括信息交換、數據計算等。P2P模式與傳統客戶/伺服器模式的關鍵區別在於Peer (對等體)與Peer在通信過程中,可以完全摒棄伺服器的角色,通過直接通信獲得共享資源或服務。
[0004]面對空間數據挖掘、空間決策支持、空間多維動態可視化分析與模擬等諸多屬於計算密集型和I/o密集型的空間應用,傳統GIS的計算和數據處理能力不能很好地滿足應用需求。隨著網格計算技術在GIS中的應用逐漸成為研究熱點,其分布式並行計算模式與系統架構將有助於提高GIS的整體性能和運行效率。因此,分布式並行計算將成為解決傳統GIS計算能力不足問題的重要方法。海量空間數據的組織與管理技術是各類複雜空間應用的基礎,也是GIS技術的核心問題。其中,空間索引技術是數據組織與管理的重要研究內容。目前,在資料庫管理系統及GIS等科研領域,空間索引技術的研究成果非常豐富,應用較為廣泛。然而,針對海量空間數據的組織、管理、存取、處理與應用的分布式並行空間索引技術研究成果較少。
[0005]ArielCary等提出了在雲平臺下運用MapReduce並行構建子R樹,將子R樹合併,形成的R樹索引是一個集中式的,這個集中式的R樹成為了它的瓶頸。
[0006]AnirbanMondal等提出了再對等網絡下建立R樹索引,其將空間劃分為相等的塊,每個對等節點維護一個等分的塊,由於存儲信息的對等節點不一定是連續的,可能破壞地理空間的連續性。

【發明內容】

[0007]本發明所要解決的技術問題是針對上述【背景技術】的不足,提供了一種在對等雲平臺上對地理空間數據建立分布式R樹索引的方法。
[0008]本發明為實現上述發明目的採用如下技術方案:一種對等結構雲平臺上構建希爾伯特R樹索引的方法,其特徵是:在P2P雲平臺中的主節點(Master)組織成對等結構的Chord網絡,首先,通過映射方法(Map)讀取數據對象,基於其地理位置得到其所處空間的希爾伯特曲線編碼;其次,基於這一編碼對數據對象進行分區,並將其傳給相應的歸約方法(Reduce);然後,歸約方法對各個分區的數據對象進行希爾伯特R子樹的構建;最後,通過安全散列函數(SHA-1)得到希爾伯特R子樹根節點編號的散列值,並將其發布到處於Chord環中的主節點(Master)上,構成完整的分布式希爾伯特R樹索引;包括如下步驟:
[0009]步驟I,假設數據集為D,設0 e D為數據集中的任一數據對象,0.1d為數據對象0的標識符,0.P為數據對象0的地理位置坐標;
[0010]步驟2,用映射方法(Map)將數據集D中的數據對象讀入,映射方法(Map)輸入的關鍵字為0.1d,值為0.P,對於輸入的數據對象O,根據其地理位置坐標0.P,將該對象映射到公階的希爾伯特空間曲線填充上(希爾伯特曲線的階數由數據集的大小決定,數據集大
小ID I,則Z1 = |_log|l)|」),並產生相應希爾伯特編碼0.he ;
[0011]步驟3,基於希爾伯特編碼0.hc,調用分區方法f將數據對象0映射到相應的分
區,分區方法f的輸入為數據對象的希爾伯特編碼,輸出為分區號,定義如下:
[0012]
J (0.hc) = \_0.hc /21' /:」IS 0.hc < 21'
[0013]則映射方法(Map)輸出的關鍵字為分區號f (0.he),值為O,根據分區方法f,數據對象將被映射到^個分區中,分區數目由處於Chord環中的主節點(Master)的數目決定,
設主節點(Master)是數目為N,則/2 = [log A7J;
[0014]步驟4,用2/2個歸約方法(Reduce)接收映射方法(Map)的輸出作為輸入,其關鍵字為分區號f (0.hc),值為O,各個歸約方法(Reduce)對於輸入的某一分區的數據對象分別進行希爾伯特R子樹的構建,並將該分區號作為構建好的希爾伯特R子樹根節點的編號;
[0015]步驟5,通過安全散列算法,計算出希爾伯特R子樹根節點編號的散列值,並將該散列值對應的希爾伯特R子樹的根節點發布到Chord環中的相應的主節點(Master)上,構成完整的分布式希爾伯特R樹索引;
[0016]至此,在對等雲平臺下建立分布式希爾伯特R樹索引已經完成,在對等雲平臺中的單獨一個主節點(Master)起到一個局部索引的作用,基於Chord的所有的主節點(Master)起到一個全局索引的作用。
[0017]本發明具有以下優點及有益效果:
[0018]I)本發明方法解決了現有技術的缺點,形成了分布式的R樹索引,較好的解決了集中式R樹的瓶頸,利用希爾伯特曲線進行分區,較好的解決了地理空間的連續性的問題。
[0019]2)在為空間數據並行建立希爾伯特R樹,其相對於傳統的建立希爾伯特R樹的索引方法其建立希爾伯特R樹索引的速度有顯著的提升。
[0020]3)本發明將緩存根節點的Mater節點組織成了 Chord環,相對於單個Master節點,不但減少了 Master節點的負擔,而且提高了 Master節點的並行處理能力,其維護開銷要低於傳統的R樹;能有效的加速查詢,其維護開銷要低於傳統的R樹,減少了 Master節點失效所造成的損失。且建立的是希爾伯特R樹的分布式索引,有效的解決了集中式索引的瓶頸,如:並行查詢的能力,處理查詢的最大的負載等。【專利附圖】

【附圖說明】
[0021]圖1是對等結構雲平臺上構建希爾伯特R樹索引的總流程圖;
[0022]圖2是對等結構雲平臺上已構建完成的希爾伯特R樹索引結構示意圖。
【具體實施方式】
[0023]下面結合附圖對發明的技術方案進行詳細說明:
[0024]在P2P雲平臺中的主節點(Master)組織成對等結構的Chord網絡。在對等結構雲平臺上構建希爾伯特R樹索引的總流程圖,如圖1所示:
[0025]步驟I,假設數據集為D,設O e D為數據集中的任一數據對象,0.1d為數據對象0的標識符,0.P為數據對象0的地理位置坐標。
[0026]步驟2,用映射方法(Map)將數據集D中的數據對象讀入。映射方法(Map)輸入的關鍵字為0.1d,值為0.P。對於輸入的數據對象O,根據其地理位置坐標0.P,將該對象映射到公階的希爾伯特空間曲線填充上(希爾伯特曲線的階數由數據集的大小決定,本文中數
據集大小ID I,則I1 = Llog|D|J),並產生相應希爾伯特編碼0.he。
[0027]步驟3,基於希爾伯特編碼0.he,調用分區方法f將數據對象0映射到相應的分
區。分區方法f的輸入為數據對象的希爾伯特編碼,輸出為分區號,定義如下:
[0028]
f {0.hc、= \_0.hc /2,',:」I < 0.hc < 21'
[0029]則映射方法(Map)輸出的關鍵字為分區號f(0.he),值為O。根據分區方法f,數據對象將被映射到2/2個分區中,分區數目由處於Chord環中的主節點的數目決定,設主節點
是數目為N,則/2 - LloS
[0030]步驟4,用^個歸約方法(Reduce)接收映射方法的輸出作為輸入,其關鍵字為分區號f (0.hc),值為O,各個歸約方法(Reduce)對於輸入的某一分區的數據對象分別進行希爾伯特R子樹的構建,並將該分區號作為構建好的希爾伯特R子樹根節點的編號。
[0031]步驟5,通過安全散列算法,計算出希爾伯特R子樹根節點編號的散列值,並將該散列值對應的希爾伯特R子樹的根節點發布到Chord環中的相應的主節點上,構成完整的分布式希爾伯特R樹索引,如圖2所示,P2P雲平臺中的主節點(Master)構成一個Chord環,根據安全散列算法,希爾伯特R子樹能均勻地分布到Chord網絡中,從而實現負載均衡的目的。
[0032]綜上所述,首先,通過映射方法(Map)讀取數據對象,基於其地理位置得到其所處空間的希爾伯特曲線編碼;其次,基於這一編碼對數據對象進行分區,並將其傳給相應的歸約方法(Reduce);然後,歸約方法對各個分區的數據對象進行希爾伯特R子樹的構建;最後,通過安全散列函數得到希爾伯特R子樹根節點編號的散列值,並將其發布到處於Chord環中的主節點(Master)上,構成完整的分布式希爾伯特R樹索引。這種方法能夠有效的建立希爾伯特R樹索引,加速希爾伯特R樹的查詢,並且能減少Master節點的負擔和負載均衡,適用於在對等雲平臺上對空間數據建立希爾伯特R樹索引。
【權利要求】
1.一種對等結構雲平臺上構建希爾伯特R樹索引的方法,其特徵是:在P2P雲平臺中的主節點組織成對等結構的Chord網絡,首先,通過映射方法讀取數據對象,基於其地理位置得到其所處空間的希爾伯特曲線編碼;其次,基於這一編碼對數據對象進行分區,並將其傳給相應的歸約方法;然後,歸約方法對各個分區的數據對象進行希爾伯特R子樹的構建;最後,通過安全散列函數得到希爾伯特R子樹根節點編號的散列值,並將其發布到處於Chord環中的主節點上,構成完整的分布式希爾伯特R樹索引;包括如下步驟: 步驟I,假設數據集為D,設0 e D為數據集中的任一數據對象,0.1d為數據對象0的標識符,0.p為數據對象0的地理位置坐標; 步驟2,用映射方法將數據集D中的數據對象讀入,映射方法輸入的關鍵字為0.1d,值為0.P,對於輸入的數據對象O,根據其地理位置坐標0.P,將該對象映射到分階的希爾伯特空間曲線填充上,希爾伯特曲線的階數由數據集的大小決定,數據集大小|D|,則Ix =l_l0g|D|_|,並產生相應希爾伯特編碼0.he ; 步驟3,基於希爾伯特編碼0.he,調用分區方法f將數據對象0映射到相應的分區,分區方法f的輸入為數據對象的希爾伯特編碼,輸出為分區號,定義如下:
【文檔編號】H04L29/08GK103617162SQ201310478326
【公開日】2014年3月5日 申請日期:2013年10月14日 優先權日:2013年10月14日
【發明者】吳家皋, 劉傑, 鄒志強 申請人:南京郵電大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀