新四季網

具有衝突指紋的數據區塊的存儲的製作方法

2023-06-03 11:23:56 1




背景技術:

數據去重複(deduplication)是用於增加存儲設備的存儲容量的技術。通過使用數據去重複,唯一數據區塊的冗餘拷貝被識別並從存儲設備移除。因而,唯一數據區塊的單個拷貝被存儲在存儲設備中。

附圖說明

關於以下附圖描述本申請的一些示例:

圖1是根據一個示例的存儲具有衝突指紋(fingerprint)的數據區塊的存儲設備的框圖;

圖2是根據一個示例的存儲具有衝突指紋的數據區塊的存儲設備的框圖;

圖3是圖示根據一個示例的存儲具有衝突指紋的數據區塊的方法的流程圖;以及

圖4是圖示根據一個示例的存儲具有衝突指紋的數據區塊的方法的流程圖。

具體實施方式

如上所述,數據去重複是用於增加存儲設備的存儲容量的技術。為了確定是否數據區塊是現有存儲的數據區塊的冗餘拷貝,生成數據區塊的指紋。指紋可以是數據區塊的循環冗餘校驗(crc)或者數據區塊的散列鍵(hashkey)。當所述指紋匹配另一個指紋時,所述匹配可以指示該數據區塊是冗餘拷貝。因而,存儲設備移除該數據區塊。

然而,所述匹配可能指示指紋衝突,而不是冗餘拷貝的指示。當具有不同內容的兩個數據區塊生成相同指紋時,指紋衝突發生。因而,數據區塊的指紋可能是衝突指紋。指紋衝突的可能性取決於指紋大小。指紋大小越大,可能性越低。因而,當僅僅依賴於指紋匹配時,數據去重複過程的準確度降低。

本文所述的示例提供了存儲具有衝突指紋的數據區塊的存儲設備。例如,存儲設備可以從源設備接收第一數據區塊。存儲設備可以生成第一數據區塊的第一指紋。存儲設備可以將第一指紋與存儲在存儲設備中的第二數據區塊的第二指紋相比較。響應於確定第一指紋匹配第二指紋,存儲設備可以基於第一數據區塊以及基於第二數據區塊而從與存儲設備關聯的多個存儲池中選擇存儲池來存儲第一數據區塊。所述多個存儲池包括與具有非衝突指紋的第一特定數據區塊關聯的第一存儲池以及與具有衝突指紋的第二特定數據區塊關聯的第二存儲池。以此方式,本文所述的示例可以增加數據去重複過程的準確性。

現在參考附圖,圖1是根據一個示例的存儲具有衝突指紋的數據區塊的存儲設備100的框圖。如本文所使用的,衝突指紋可以是從數據區塊生成的指紋,其匹配從不同的數據區塊(即,兩個數據區塊具有不同的內容)生成的另一個指紋。例如,存儲設備100可以是在所存儲的數據上執行數據去重複的存儲系統,存儲陣列、硬碟驅動器、固態驅動器或適於存儲數據的任何電子設備。

存儲設備100可以包括控制器102、第一存儲池104、第二存儲池106和指紋資料庫108。控制器102可以是例如中央處理單元(cpu)、基於半導體的微處理器,和/或適於檢索和執行在存儲設備100的計算機可讀存儲介質(未示出)中存儲的指令的其他硬體設備。控制器102可以取出、解碼和執行指令以控制將具有衝突指紋的數據區塊存儲到存儲池(諸如第一存儲池104)的過程。作為替換或除了檢索和執行指令之外,控制器102還可以包括至少一個電子電路,其包括用於執行指令的功能的電子組件。

第一存儲池104可以包括,例如,一個或多個存儲設備、一個或多個邏輯存儲卷等。第一存儲池104可以存儲具有非衝突指紋的數據區塊。如本文所使用的,非衝突指紋可以是沒有存儲在指紋資料庫108中的匹配指紋的指紋。第二存儲池106可以類似於第一存儲池104。第二存儲池106可以存儲具有衝突指紋的數據區塊。指紋資料庫108可以是存儲數據區塊的指紋的資料庫,所述數據區塊被存儲在存儲設備100中或者與存儲設備100相關聯。

在操作期間,源設備110可以將數據區塊112傳送到存儲設備100以供存儲。源設備110可以是計算設備,諸如平板計算機、膝上型計算機、臺式計算機、智慧型電話等。響應於接收到數據區塊112,控制器102可以執行數據去重複操作來確定數據區塊112如何被存儲。控制器112可以生成數據區塊112的指紋114。控制器102可以將指紋114與存儲在指紋資料庫108中的至少一個指紋相比較。當指紋114不匹配指紋資料庫108中的任何指紋時,控制器102可以確定指紋114是非衝突指紋。

因而,控制器102可以確定數據區塊112是唯一數據區塊,並且不是已經存儲在存儲設備100中的現有數據區塊的冗餘拷貝。控制器102可以在第一存儲池104中存儲數據區塊112。控制器102還可以將指紋114存儲到指紋資料庫108以供與後續生成的指紋比較。

當指紋114匹配指紋資料庫108中的特定指紋時,控制器102可以將數據區塊112與來自第一存儲池104和/或第二存儲池106的具有特定指紋的特定數據區塊相比較。例如,控制器102可以經由按字節比較將數據區塊與特定數據區塊相比較。當數據區塊112匹配特定數據區塊時,控制器102可以確定數據區塊112是特定數據區塊的冗餘拷貝。因而,控制器102可以存儲對其中存儲特定數據區塊的存儲池中的特定數據區塊的引用或指向其的指針。控制器102還可以丟棄指紋114。

當數據區塊112不匹配特定數據區塊時,控制器102可以確定數據區塊112是唯一數據區塊,其當前未被存儲在存儲設備100中。控制器102可以確定指紋114是衝突指紋。控制器102可以在第二存儲池106中存儲數據區塊112。在一些示例中,在將數據區塊112與特定數據區塊比較並且將特定指紋與數據區塊112相關聯之後,控制器102可以丟棄指紋114。因而,通過利用不同的存儲池,一個用於具有非衝突指紋的數據區塊,並且一個用於具有衝突指紋的數據區塊,具有衝突指紋的唯一數據區塊可以被存儲設備100高效地處理。

在一些示例中,數據區塊可以基於數據區塊的指紋的三級頁錶轉換而被存儲到第一存儲池104中的位置。數據區塊可以基於數據區塊的偏移的三級頁錶轉換而被存儲到第二存儲池106中的位置。因而,相同數據區塊存儲和檢索機制可以用於存儲池104和106。

圖2是根據一個示例的存儲具有衝突指紋的數據區塊的存儲設備200的框圖。存儲設備200可以類似於圖1的存儲設備100。存儲設備200可以包括控制器202和計算機可讀存儲介質204。控制器202可以類似於控制器102。控制器202可以取出、解碼和執行指令206-214以控制將具有衝突指紋的數據區塊存儲到存儲池(諸如第一存儲池104)的過程。

計算機可讀存儲介質204可以是包含或存儲可執行指令的任何電子、磁性、光學或其他物理存儲設備。因而,計算機可讀存儲介質204可以是例如隨機存取存儲器(ram)、電可擦除可編程只讀存儲器(eeprom)、光碟等。在一些示例中,計算機可讀存儲介質204可以是非瞬時存儲介質,其中術語「非瞬時」不包含瞬時傳播信號。如下詳細所述,計算機可讀存儲介質204可以被編碼有一系列處理器可執行指令206-214,其用於在存儲設備200中存儲具有衝突指紋的數據區塊。

數據區塊接收指令206可以從源設備接收數據區塊以供存儲,諸如圖1的數據區塊112。指紋生成指令208可以基於數據區塊而生成指紋,諸如指紋114。指紋比較指令210可以將該指紋與存儲在存儲設備200中的其他指紋相比較。

當所述指紋匹配存儲設備200中的另一個指紋時,數據區塊比較指令212可以將所述數據區塊與用於生成匹配指紋的另一個數據區塊相比較。當所述數據區塊匹配另一個數據區塊時,數據區塊存儲指令214可以在第一存儲池中存儲對另一個數據區塊的引用或指向其的指針,所述第一存儲池與具有不衝突指紋的數據區塊相關聯,諸如第一存儲池104。當所述數據區塊不匹配另一個數據區塊時,數據區塊存儲指令214可以在與第一存儲池不同的第二存儲池(諸如第二存儲池106)中存儲所述數據區塊。第二存儲池可以與具有衝突指紋的數據區塊相關聯。當所述指紋不匹配存儲設備200中的指紋時,數據區塊存儲指令214可以在第二存儲池中存儲所述數據區塊。

圖3是圖示根據一個示例的存儲具有衝突指紋的數據區塊的方法300的流程圖。方法300可以使用圖1的存儲設備100和/或圖2的存儲設備200來實現。方法300包括,在302處,在存儲設備處從源設備接收第一數據區塊。例如,參考圖1,存儲設備100可以從源設備110接收數據區塊112。

方法300還包括,在304處,生成第一數據區塊的第一指紋。例如,參考圖1,控制器102可以基於數據區塊112而生成指紋114。方法300還包括,在306處,將第一指紋與第二數據區塊的第二指紋相比較。例如,參考圖1,控制器102可以將指紋114與存儲在指紋資料庫108中的至少一個指紋相比較。

方法300還包括,在308處,當第一指紋匹配第二指紋時,基於第一數據區塊與第二數據區塊之間的比較而從與存儲設備關聯的多個存儲池中選擇存儲池以存儲第一數據區塊,其中所述多個存儲池包括與具有非衝突指紋的第一特定數據區塊關聯的第一存儲池以及與具有衝突指紋的第二特定數據特定數據區塊關聯的第二存儲池。例如,參考圖1,當指紋114匹配來自指紋資料庫108的指紋時,控制器102可以將數據區塊112與用於生成匹配指紋的數據區塊相比較。當數據區塊112匹配所述數據區塊時,控制器102可以在第一存儲池104中存儲數據區塊112。當數據區塊112不匹配所述數據區塊時,控制器102可以在第二存儲池106中存儲數據區塊。

方法300還包括,在310處,當第一指紋不匹配第二指紋時,在第一存儲池中存儲第一數據區塊。例如,參考圖1,當指紋114不匹配指紋資料庫108中的任何指紋時,控制器102可以將數據區塊存儲到第一存儲池104。

圖4是圖示根據一個示例的存儲具有衝突指紋的數據區塊的方法400的流程圖。方法400可以使用圖1的存儲設備100和/或圖2的存儲設備200來實現。方法400包括,在402處,接收數據區塊。例如,參考圖1,存儲設備100可以從源設備110接收數據區塊112。

方法400還包括,在404處,生成指紋。例如,參考圖1,控制器102可以基於數據區塊112而生成指紋114。方法400還包括,在406處,將所述指紋與存儲設備中的一個或多個指紋相比較。例如,參考圖1,控制器102可以將指紋114與存儲在指紋資料庫108中的至少一個指紋相比較。

當所述指紋不匹配任何指紋時,方法400還包括將數據區塊存儲到非衝突指紋存儲池。例如,參考圖1,控制器102可以將數據區塊存儲到存儲池104。當所述指紋匹配某個指紋時,方法400還包括,在410處,將數據區塊與用於生成匹配指紋的另一個數據區塊相比較。例如,參考圖1,控制器102可以將數據區塊112與用於生成匹配指紋的特定數據區塊相比較。

在408處,當所述數據區塊匹配另一個數據區塊時,所述數據區塊被存儲在非衝突指紋存儲池中。在412處,當所述數據區塊不匹配另一個數據區塊時,方法400還包括將所述數據區塊存儲到衝突指紋存儲池。例如,參考圖1,控制器102可以在第二存儲池106中存儲數據區塊112。

根據前文,本文公開的示例使得存儲設備能夠存儲具有衝突指紋的數據區塊。存儲設備可以將數據區塊的指紋與存儲在存儲設備中的一個或多個指紋相比較。當存在匹配指紋時,存儲設備可以將所述數據區塊與用於生成匹配指紋的另一個數據區塊相比較。當所述數據區塊匹配另一個數據區塊時,所述數據區塊可以是另一個數據區塊的冗餘拷貝。因而,存儲設備可以存儲對另一個數據區塊的引用或指向其的指針。當所述數據區塊不匹配另一個數據區塊時,所述數據區塊可以是唯一數據區塊。因而,存儲設備可以將所述數據區塊存儲到與用於存儲另一個數據區塊的存儲池不同的存儲池。因而,具有衝突指紋的數據區塊不被錯誤地識別為另一個數據區塊的冗餘拷貝,並且存儲設備中的數據去重複過程的準確性可以增加。

「包含」、「包括」或「具有」的使用是同義的,並且本文中其變形意為包括性或開放式的,並且不排除附加的未記載元件或方法步驟。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀