一種文件包分卷的識別方法及系統的製作方法
2023-06-06 22:34:01 2
專利名稱::一種文件包分卷的識別方法及系統的製作方法
技術領域:
:本發明涉及電腦與網際網路領域,特別是涉及一種文件包分巻的識別方法及系統。
背景技術:
:網絡中為了文件傳輸的方便,需要將一些體積過大的原始文件拆分成多個文件塊,例如使用文件分塊軟體將文件拆分成多個文件包分巻,然後將各個文件包分巻傳輸至網絡中其他接收端,接收端接收到文件包分巻後,文件分塊軟體根據各文件包分巻的標題及分巻號,判斷各個文件包分巻是否屬於同組文件包分巻,如果有所有的屬於同組的文件包分巻,就能夠將其還原為原始文件。但是,如果屬於同組文件包分巻的部分文件包分巻的標題被更改,即便實際上屬於同組文件包分巻,文件分塊軟體也無法正確識別,從而無法將文件包分巻所存儲的原始文件還原;或者,如果網絡上存在不屬於同組但命名規則卻恰好一致的文件包分巻,用戶很可能將其誤判為屬於同組文件包分巻而獲取,但獲取之後同樣不能將文件包分巻所存儲的原始文件還原。可見,通過文件包分巻標題來識別文件包分巻的方法,其有效性與可靠性均無法得到保證。
發明內容有鑑於此,本發明實施例^是供一種文件包分巻的識別方法及系統。所述文件包分巻識別方法,包括獲取多個文件包分巻中的各文件包分巻的識別信息,所述識別信息包括所述各文件包分巻的分巻號與文件列表,所述分巻號為生成文件包分巻時各文件包分巻在同組文件包分巻中的序號,所述文件列表記錄了各文件包分巻所存儲文件的屬性信息;根據所獲取的各文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻。所述文件包分巻識別系統,包括信息獲取單元,用於獲取多個文件包分巻中的各文件包分巻的識別信息,所述識別信息包括所述各文件包分巻的分巻號與文件列表,所述分巻號為生錄了各文件包分巻所存儲文件的屬性信息;識別單元,用於根據所述信息獲取單元獲取的各文件包分巻的識別信息,識別所述多個文件包分巻是否屬於同組文件包分巻。與現有的通過分巻標題識別文件包分巻的方法相比,本發明實施例通過表是在文件包分巻創建的時候產生,產生後無法對其進行修改,因此通過分巻號及文件列表識別文件包分巻是否屬於同組,其有效性和可靠性都得到提高。圖1為本發明第一實施例文件包分巻識別方法的流程圖;圖2為搜索結果排序示意圖;圖3為搜索結果整合示意圖4為本發明第二實施例文件包分巻識別方法的流程圖;圖5為本發明第三實施例文件包分巻識別系統結構示意圖;圖6為本發明第四實施例文件包分巻識別系統結構示意圖;圖7為本發明第五實施例文件包分巻識別系統結構示意圖;圖8為本發明第六實施例文件包分巻識別系統結構示意圖;圖9為本發明第七實施例文件包分巻識別系統結構示意圖;圖10為本發明第八實施例文件包分巻識別系統結構示意圖;圖11為本發明第九實施例文件包分巻識別系統結構示意圖;圖12為本發明第十實施例文件包分巻識別系統結構示意圖;圖13為本發明第十一實施例文件包分巻識別系統結構示意圖。具體實施例方式首先對本發明實施例文件包分巻的識別方法進行說明。可實現文件分巻處理的軟體有多種,比如WinRAR。在使用分巻處理軟體進行分巻處理過程中產生的文件稱為文件包分巻,本發明實施例通過比較各文件包分巻的分巻號及文件列表,識別多個文件包分巻是否屬於同組文件包分巻。下面結合附圖,對本發明實施例進行詳細描述。如圖1所示為本發明實施例文件包分巻的識別方法,具體步驟如下步驟IOI,獲取多個文件包分巻中的各文件包分巻的識別信息,所述識別信息包括所述各文件包分巻的分巻號與文件列表,所述分巻號為生成文件包分巻時各文件包分巻在同組文件包分巻中的序號,所述文件列表記錄了各文件包分巻所存儲文件的屬性信息。較佳地,可通過獲取網絡中所存儲的文件包分巻的文件頭信息,分析該絡資源獲取系統(如網絡爬蟲程序spider)獲取文件包分巻的文件頭信息。所述分巻號及所述文件列表一經生成就不能被更改。所述各文件包分巻所存儲文件的屬性信息包括文件名,文件大小,文件修改時間等。步驟102,根據所獲取的各文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻。較佳地,所述根據所獲取的各文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻包括比較分巻號相鄰的文件包分巻的文件列表,如果分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,則確定所述文件包分巻屬於同組文件包分巻。各文件包分巻有後續分巻屬性,該屬性用於標識文件包分巻是否為同組文件包分巻中的最後一個文件包分巻。如果一個文件包分巻沒有後續分巻,包分巻。則較佳地,各文件包分巻還具有後續分巻屬性,該後續分巻屬性為生成文件包分巻時一併生成,如果一個文件包分巻的該屬性值為是,則該文件包分巻有後續分巻,如果該屬性值為否,則該文件包分巻為其所屬同組文件包分巻的最後一個文件包分巻;當一個文件包分巻的所述是否有後續分巻屬性比較。同組文件包分巻中存儲了一個或多個文件,在同組文件包分巻所存儲的文件中,一個文件可能會被切分成幾部分放到分巻號相鄰的文件包分巻中,所以在文件包分巻的文件列表中,還包括文件在各文件包分巻中是否存儲完整的信息,例如在WinRARj欠件所生成的rar分巻中,文件完整度信息定義如下1)文件完整存在於該分巻,文件完整度信息為空;2)文件有部分內容存在於該分巻之前的分巻,用符號',表示;4)文件既有部分內容存在於該分巻前面的分巻,也有部分內容存在於該分巻後面的分巻,用符號',表示。例如有一組rar分巻,總共有4個rar分巻,分巻號分別為1-4號,各rar分巻的文件列表的信息如表1所示tableseeoriginaldocumentpage12表1由表1可以看到,該組rar分巻共存儲了2個文件,"Thunder.exe"及"WebThunder.exe"。在分巻1中,存儲了Thunder.exe文件,'->,表示Thunder.exe在分巻1中並不完整,還有部分內容在後面的分巻裡。在分巻2中,同樣存儲了Thunder.exe文件,''表示該文件有部分內容在前面的分巻裡,同時也有部分內容在後面的分巻裡。在分巻3中,有Thunder.exe和WebThunder.exe兩個文件,',表明它有部分內容在後面的分巻。在分巻4中存儲了文件WebThunder.exe,',或',,那麼n+l分巻中的firstfile與n分巻中的lastfile—定是相同的文件,他們的文件屬性信息必然相同。所以,如果分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,則確定所述文件包分巻屬於同組文件包分巻。通常情況下,分巻n中lastfile的文件完整信息度都表示為'->,或',,因此,根據上述規則,我們在確定兩個rar分巻是否屬於同一組的時候,就可以先比較它們的分巻號,如果分巻號是相鄰的,再比較前一分巻的lastfile與後一分巻的firstfile的關係,例如在表1中,就可以通過Thunder.exe確定分巻l、2、3是同一組,通過WebThunder.exe確定3、4是同一組分巻,綜合以上結果,就可以確定l、2、3、4都是屬於同一組。如果分巻n中lastfile的文件完整度信息恰好為'<-,或'-,,例如表2所示,此時就無法確定分巻2與分巻3是否屬於同一分組,也就無法識別出一組完整的分巻。對於這種情況,就需要結合分巻的其他特徵來進行判斷。表2同組rar分巻具有以下基本特點1)除同組rar分巻中的最後一個分巻之外,同組其它各分巻大小都是相同的,並且最後一個分巻的大小等於或小於其它分巻的大小。2)每個rar分巻的標題有統一格式。如"三國志.partl.rar",其中"三國志"是分巻名,"parti"表明是本組分巻中的第一個分巻,"rar"是分巻格式後綴名。如果存在另一個命名規則一致的分巻"三國志.part2.rar",則認為該分巻與上述分巻屬於同一組。在本發明優選實施例中,針對上述特殊的情況,即通過文件列表信息無法確定分巻是否屬於同一組的情況,還需要結合分巻大小、分巻標題進行綜合判斷,較佳地,所述各文件包分巻的識別信息還包括所述文件包分巻的分巻大小。即結合文件包分巻的大小信息來判斷是否屬於同組文件包分巻。較佳地,當所述各文件包分巻的識別信息還包括所述文件包分巻的分巻大小時,所述根據所獲取的文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻包括當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,並且,所述分巻號相鄰的文件包分巻的分巻大小相同時,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性不相同,或者,所述分巻號相鄰的文件包分巻的分巻大小不相同時,則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。對於已識別出分組信息的文件包分巻,可以進一步通過建立同組文件包分巻的關聯,存儲同組文件包分巻的關聯信息,將原本需要對所有零散文件包分巻進行的操作,能夠以組的形式進行整體處理,從而為用戶提供搜索、下載等服務。較佳地,所述方法進一步包括步驟103,建立屬於同組的各文件包分巻之間的關聯。建立各文件包分巻之間的關聯可有不同的方法,可通過文件包分巻的多種屬性建立關聯,例如文件包分巻的名稱、文件包分巻的內容籤名CID(ContentIDentity)或存放地址等。CID是根據預設的算法對文件的內容數據進行計算後獲得的,可唯一標識被處理的文件。所述的預設的算法可以是對不同數據內容的二進位文件處理得到不同處理結果的任一算法,其處理結果即CID。確定CID的其中一種方法可為提取文件的前面32k字節、中間32k字節、尾部32k字節數據,將所獲取的三部分數據順序連接,採用哈希算法,例如信息摘要算法(md5,message-digestalgorithm5),計算連接所得的96k字節數據的md5值,作為該文件的CID。通過計算每個rar分巻的CID,就可以唯一標識網際網路上的每一個rar分巻資源。則較佳地,所述建立屬於同組的各文件包分巻之間的關聯包括根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;建立各文件包分巻的CID之間的對應關係。或者,較佳地,所述建立屬於同組的各文件包分巻之間的關聯包括獲得一個組籤名,所述組籤名為所述屬於同組的文件包分巻的共同標識;建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯。其中,所述組籤名可以是編號、同組文件包分巻中任一文件包分巻的文件名稱或文件包分巻的內容籤名CID等任何可將不同的文件包分巻組區分開的標識。則較佳地,所述獲得一個組籤名,建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯包括根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;根據所述CID,獲得所述文件包分巻所在組的組籤名GID;建立所述組籤名GID及所述屬於同組的各文件包分巻CID之間的關聯。可將同組文件包分巻中的第一個文件包分巻(即分巻號最小的文件包分巻)的標識作為該組的標識。還可將所述屬於同組的各文件包分巻的內容籤名CID連接起來組成一段值,再通過所述預設算法計算該段值,從而得到一個新的值,並將該新的值作為該組的標識。所以較佳地,所述根據所述CID,獲得所述文件包分巻所在組的組籤名GID的步驟包括選取屬於同組文件包分巻中分巻號最小的文件包分巻的CID作為該組文件包分巻的組籤名GID;或將所述屬於同組的各文件包分巻的內容籤名CID組合為一個CID集合,將根據所述預設算法計算所述CID集合得到的值,作為該組文件包分巻的組籤名GID。通過上述方法可建立屬於同組文件包分巻的關聯,實現了將網際網路中屬於同組的文件包分巻資源進行整合。應用所建立的同組文件包分巻信息,可以進一步為用戶提供搜索和下載服務,下面將分別對這兩種服務的實施方案進行詳細描述。提供文件包分巻搜索服務首先需要為各個分巻包的分巻相關信息與其對應內容的分巻搜索信息建立關聯。所述分巻相關信息為需要在搜索結果中作為搜索結果返回的文件包分巻的信息,例如各文件包分巻的名稱、對應的內容描述信息及/或統一資源定位符URL存放地址等。所述分巻搜索信息是對分巻內容的描述。用戶進行搜索時輸入的關鍵字將與所述分巻搜索信息進行匹配,匹配成功的則說明是用戶需要的一個搜索結果。例如,有三個文件包分巻的分巻搜索信息分別為"三國志.partl"、"三國志,,及"三國志.part2,,,其中,已建立第一個與第三個文件包分巻屬於同組文件包分巻的對應關係,當用戶輸入關鍵字"三國志"進行搜索,則該三個分巻搜索信息都將與關鍵字"三國志,,匹配成功,可將該三個分巻搜索信息對應的分巻相關信息作為搜索結果呈現,並可根據所建立的屬於同組的各文件包分巻之間的關聯,將第一個與第三個文件包分巻的分巻相關信息排序在一起返回。則較佳地,所述方法還包括步驟104,當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;步驟105,根據所建立的屬於同組的各文件包分巻之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息排序在一起作為搜索結果返回。現有的搜索技術所返回的搜索結果可能如圖2中左半部分所示,滿足搜索條件的屬於同組的文件包分巻、不屬於同組的文件包分巻及非文件包分巻文件混在一起,用戶很難找到需要的內容(圖2中所示的"第一組"、"第二組"其實並不會在搜索結果中出現,在此只是為了便於理解而添加的注釋)。而在本發明實施例中,如圖2中右半部分所示,搜索結果中屬於同組的文件包分巻將排序在一起返回,如此可方便用戶在網絡中查找屬於同組的多個文件包分巻。進一步,如果將屬於同組的文件包分巻作為整體來進行顯示,搜索的返回內容會明顯減少,使得搜索結果更簡潔,可以使用戶很直觀地找到同組的所有分巻。如圖3所示,當用戶搜索"三國志"時,可利用前述獲得的同組文件包分巻的組籤名,將屬於同組的文件包分巻作為一整體,則搜索結果將如圖3右側虛線框中所示,僅顯示屬於同組文件包分巻的組籤名,圖3中連線表示將屬於同組的文件包分巻作為整體後的搜索結果與其對應的同組的各文件包分巻。其中"2)三國志(3分巻)"是第一組分巻,包括"三國志.partl.rar"、"三國志.part2.rar"、"三國志.part3.rar,,;"4)三國志(5分巻),,是第二組分巻,包括"三國志.partl.rar"、"三國志.part2.rar"、"三國志.part3.rar"、"三國志.part4.rar"、"三國志.part5.rar"。如此的^:索結果以更簡潔的形式呈現,如當用戶選擇"2)三國志(3分巻)"時,則可將其對應的"三國志.partl.rar"、"三國志.part2.rar"、"三國志.part3.rar"三個文件包分巻返回給用戶。返回的形式可有多種,如另外提供一個窗口以顯示所述三個文件包分巻,或當用戶點擊一個組籤名時,在組籤名的下方以樹狀目錄的形式顯示該組籤名所對應的屬於同組的文件包分巻。則較佳地,該方法還包括當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;根據所述組籤名及所述屬於同組的各文件包分巻的分巻相關信息之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息對應的組籤名作為搜索結果返回;當用戶選擇所述組籤名時,將所述組籤名所對應的屬於同組的各文件包分巻的分巻相關信息返回給用戶。提供文件包分巻下載服務因為需要獲取同組的文件包分巻才能將所存儲的文件還原,所以用戶下載一個文件包分巻時,一般會需要下載同組的其他文件包分巻。請參照圖4(圖4中步驟101、102及103的內容與圖1中同樣編號的步驟內容相同,在此不再贅述),則較佳地,該方法還包括步驟106,當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所建立的屬於同組的各文件包分巻之間的關聯,獲取並返回屬於同組的其他文件包分巻的分巻相關信息;或,步驟107,當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所建立的屬於同組的各文件包分巻之間的關聯,獲取屬於同組的其他文件包分巻的存放地址,並建立下載任務。當從網絡中獲取文件包分巻時,可同時記錄其對應的統一資源定位符(URL,UniformResourceLocator)地址,則還可建立每個文件包分巻的相關信息及其對應的URL地址的對應關係。例如,可建立文件包分巻的CID與對應的URL地址的對應關係。當用戶在下載一個文件包分巻的時候,可以才艮據前述建立的CID與GID的對應關係進行查詢,查到與CID對應的GID之後,再通過GID查到其它同組的文件包分巻的CID,然後把這些CID對應的文件包分巻的相關信息返回,提醒用戶是否需要下載其它文件包分巻,如用戶確認需要下載,則獲取其他文件包分巻的URL地址,並建立其它文件包分巻的下載。這就使得用戶不必重複去查找並下載同組其它文件包分巻,特別是文件包分巻數目很多的時候,大大方便了用戶的操作。而且,有時候用戶在下載時,並不知道還有其它文件包分巻,通過這種方法,可以避免用戶只是下本發明實施例還提供一種文件包分巻識別系統,如圖5所示,包括信息獲取單元610,用於獲取多個文件包分巻中的各文件包分巻的識別信息,所述識別信息包括所述各文件包分巻的分巻號與文件列表,所述分巻號表記錄了各文件包分巻所存儲文件的屬性信息;識別單元620,用於根據所述信息獲取單元獲取的各文件包分巻的識別信息,識別所述多個文件包分巻是否屬於同組文件包分巻。通過使用該系統,可識別多個文件包分巻是否屬於同組文件包分巻。較佳地,該文件包分巻識別系統可以進一步包括建立單元630,用於建立屬於同組的各文件包分巻之間的關聯。如圖6所示,較佳地,所述信息獲取單元610可以為網絡資源獲取單元611,用於獲取各文件包分巻的頭信息,分析頭信息得到文件包分巻的所述識別信息。所述網絡資源獲取單元611可為網絡爬蟲spider等用於獲取網絡資源的程序。較佳地,所述識別單元620可以是列表識別單元621,用於比較分巻號相鄰的文件包分巻的文件列表,如果分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;否則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。各文件包分巻中有後續分巻屬性,用於標識該文件包分巻是否為同組的最後一個文件包分巻,當一個文件包分巻為同組文件包分巻中的最後一個文件包分巻(分巻號為同組中最大的)時,則無需將該最後一個文件包分巻與分巻號大於自身的文件包分巻進行比較,則較佳地,所述比較分巻號相鄰的文件包分巻的文件列表,包括獲取各文件包分巻的後續分巻屬性,該後續分巻屬性為生成文件包分巻時一併生成,如果一個文件包分巻的該屬性值為是,則該文件包分巻有後續分巻,如果該屬性值為否,則該文件包分巻為其所屬同組文件包分巻的最後一個文件包分巻;當一個文件包分巻的所述是否有後續分巻屬性為否時,則包分巻進行比較。除了通過各文件包分巻的分巻號與文件列表,還可結合文件包分巻的分巻大小來確定是否屬於同組文件包分巻,則較佳地,所述各文件包分巻的相關信息還包括所述文件包分巻的分巻大小。當所述各文件包分巻的相關信息還包括所述文件包分巻的分巻大小時,壽支佳地,所述識別單元620,還可以是綜合識別單元622,用於當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,並且,所述分巻號相鄰的文件包分巻的分巻大小相同時,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性不相同,或者,所述分巻號相鄰的文件包分巻的分巻大小不相同時,則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。所述建立單元630可通過多種方式建立屬於同組文件包分巻之間的關聯,參見圖7所示,在一種實施例中,所述建立單元630可以包括CID計算子單元631,用於根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;及第一建立子單元632,用於建立各文件包分巻的CID之間的對應關係。由於不同文件包分巻的CID是唯一的,所以通過CID建立的同組文件包分巻的對應關係將十分準確。參見圖8所示,較佳地,在另一種實施例中,所述建立單元630可以包括組籤名獲取子單元633,用於獲得一個組籤名,所述組籤名為所述屬於同組的各文件包分巻的共同標識;及第二建立子單元634,用於建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯。即將屬於同組的文件包分巻通過一個組籤名來建立關聯。參見圖9所示,當將屬於同組的文件包分巻通過一個組籤名來建立關聯時,該組籤名可根據文件包分巻的CID來獲得,則較佳地,所述建立單元630還可以進一步包括CID計算子單元631,用於根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;所述組籤名獲取子單元633可以為GID生成子單元635,用於根據所述CID,獲得所述文件包分巻所在組的組籤名GID;所述第二建立子單元634可以為組建立子單元636,用於建立所述組籤名GID及所述屬於同組的各文件包分巻CID之間的關聯。所述^^艮據所述CID,獲得所述文件包分巻所在組的組籤名GID可有不同的實施方式,參見圖IO所示,較佳地,所述GID生成子單元635為GID第一子單元637,用於選取屬於同組文件包分巻中分巻號最小的文件包分巻的CID作為該組文件包分巻的組籤名GID;或所述GID生成子單元635為GID第二子單元638,用於將所述屬於同組的各文件包分巻的內容籤名CID組合為一個CID集合,將根據所述預設算法計算所述CID集合得到的值,作為該組文件包分巻的組籤名GID。在建立屬於同組文件包分巻的關聯後,可進一步為用戶提供文件包分巻的搜索和下載服務。當該系統用於提供搜索服務時,可有不同的實施方式方式一、可根據所建立的屬於同組文件包分巻之間的關聯,在搜索結果中屬於同組的文件包分巻排序在一起作為搜索結果返回。參見圖ll所示,圖11中信息獲取單元610、識別單元620及建立單元630的功能分別與圖5中同樣編號的單元功能相同,在此不再贅述。所述系統還可包括第一搜索單元641,用於當用戶通過關鍵字搜索文件包分巻時,乂人預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;及第一返回單元642,用於根據所建立的屬於同組的各文件包分巻之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息排序在一起作為搜索結果返回。方式二、可將屬於同組的文件包分巻整合在一起,用一個組籤名作為搜索結果返回,以使搜索結果更簡潔。參見圖12所示,圖12中信息獲取單元610、識別單元620及建立單元630的功能分別與圖5中同樣編號的單元功能相同,在此不再贅述。較佳地,所述系統還可以包括第二搜索單元643,用於當用戶通過關鍵字搜索文件包分巻時,乂人預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;第二返回單元644,用於根據所述組籤名及所述屬於同組的各文件包分巻的分巻相關信息之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息對應的組籤名作為^t叟索結果返回;第三返回單元645,用於當用戶選擇所述組籤名時,將所述組籤名所對應的屬於同組的各文件包分巻的分巻相關信息返回給用戶。當該系統用於提供下載服務時,可有不同的實施方式,參見圖13所示方式一、當用戶下載一個文件包分巻時,可將屬於同組的其他文件包分巻的相關信息,如文件名、下載地址等,返回給用戶。則所述系統還包括第一下載單元646,用於當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所述建立單元630所建立的屬於同組的各文件包分巻之間的關聯,獲取並返回屬於同組的其他文件包分巻的分巻相關信息。方式二、當用戶下載一個文件包分巻時,可直接為用戶建立屬於同組的其他文件包分巻的下載任務,無需用戶自己查找。則所述系統還包括第二下載單元647,用於當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所述建立單元630所建立的屬於同組的各文件包分巻之間的關聯,獲取屬於同組的其他文件包分巻的存放地址,並建立下載任務。綜上,本發明實施例通過結合文件包分巻的分巻號及文件列表來識別多個文件包分巻是否屬於同組文件包分巻,由於分巻號及文件列表是在分巻創建的時候產生,且產生後無法對其進行修改,因此通過分巻號及文件列表識別文件包分巻是否屬於同組,其有效性和可靠性都得到提高。在識別屬於同組的文件包分巻後,可建立其關聯,並進一步提供搜索或下載服務,可使用戶方便的獲取同組的文件包分巻。對於系統實施例而言,由於其基本相應於方法實施例,所以描述得比庫交簡單,相關之處參見方法實施例的部分說明即可。以上所描述的系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下,即可以理解並實施。以上所述僅是本發明的具體實施方式,應當指出,對於本
技術領域:
的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護範圍。權利要求1、一種文件包分卷識別方法,其特徵在於,包括獲取多個文件包分卷中的各文件包分卷的識別信息,所述識別信息包括所述各文件包分卷的分卷號與文件列表,所述分卷號為生成文件包分卷時各文件包分卷在同組文件包分卷中的序號,所述文件列表記錄了各文件包分卷所存儲文件的屬性信息;根據所獲取的各文件包分卷識別信息識別所述多個文件包分卷是否屬於同組文件包分卷。2、根據權利要求1所述的方法,其特徵在於,所述獲取多個文件包分巻的識別信息包括獲取各文件包分巻的文件頭信息,分析文件頭信息得到文件包分巻的所述識別信息。3、根據權利要求1所述的方法,其特徵在於,所述根據所獲取的各文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻包括比較分巻號相鄰的文件包分巻的文件列表;如果分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;否則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。4、根據權利要求3所述的方法,其特徵在於,所述比較分巻號相鄰的文件包分巻的文件列表,包括獲取各文件包分巻的後續分巻屬性,該後續分巻屬性為生成文件包分巻時一併生成,如果一個文件包分巻的該屬性值為是,則該文件包分巻有後續分巻,如果該屬性值為否,則該文件包分巻為其所屬同組文件包分巻的最後一個文件包分巻;當一個文件包分巻的所述後續分巻屬性為否時,則不將該文件包分巻與分巻號大於該文件包分巻的文件包分巻進行比較。5、根據權利要求1所述的方法,其特徵在於,所述各文件包分巻的識別信息還包括所述文件包分巻的分巻大小。6、根據權利要求5所述的方法,其特徵在於,所述根據所獲取的各文件包分巻識別信息識別所述多個文件包分巻是否屬於同組文件包分巻包括當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,並且,所述分巻號相鄰的文件包分巻的分巻大小相同時,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性不相同,或者,所述分巻號相鄰的文件包分巻的分巻大小不相同時,則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。7、根據權利要求1至6中任一項所述的方法,其特徵在於,該方法進一步包括建立屬於同組的各文件包分巻之間的關聯。8、根據權利要求7所述的方法,其特徵在於,所述建立屬於同組的各文件包分巻之間的關聯包括根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;建立各文件包分巻的CID之間的對應關係。9、根據權利要求7所述的方法,其特徵在於,所述建立屬於同組文件包分巻之間的關聯包括獲得一個組籤名,所述組籤名為所述屬於同組的文件包分巻的共同標識;建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯。10、根據權利要求9所述的方法,其特徵在於,所述獲得一個組籤名,建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯包括根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;才艮據所述CID,獲得所述文件包分巻所在組的組籤名GID;建立所述組籤名GID及所述屬於同組的各文件包分巻CID之間的關聯。11、根據權利要求IO所述的方法,其特徵在於,所述根據所述CID,獲得所述文件包分巻所在組的組籤名GID的步驟包括選取屬於同組文件包分巻中分巻號最小的文件包分巻的CID作為該組文件包分巻的組籤名GID;或將所述屬於同組的各文件包分巻的內容籤名CID組合為一個CID集合,將根據所述預設算法計算所述CID集合得到的值,作為該組文件包分巻的組籤名GID。12、根據權利要求7所述的方法,其特徵在於,該方法還包括當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;根據所建立的屬於同組的各文件包分巻之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息排序在一起作為搜索結果返回。13、根據權利要求9所述的方法,其特徵在於,該方法還包括當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;根據所述組籤名及所述屬於同組的各文件包分巻的分巻相關信息之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息對應的組籤名作為搜索結果返回;當用戶選擇所述組籤名時,將所述組籤名所對應的屬於同組的各文件包分巻的分巻相關信息返回給用戶。14、根據權利要求7所述的方法,其特徵在於,該方法還包括當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所建立的屬於同組的各文件包分巻之間的關聯,獲取並返回屬於同組的其他文件包分巻的分巻相關信息;或當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所建立的屬於同組的各文件包分巻之間的關聯,獲取屬於同組的其他文件包分巻的存放地址,並建立下載任務。15、根據權利要求12至14中任一項所述的方法,其特徵在於,所述分巻相關信息為各文件包分巻的名稱、對應的內容描述信息及/或統一資源定位符URL存放地址。16、一種文件包分巻識別系統,其特徵在於,包括信息獲取單元,用於獲取多個文件包分巻中的各文件包分巻的識別信息,錄了各文件包分巻所存儲文件的屬性信息;識別單元,用於根據所述信息獲取單元獲取的各文件包分巻的識別信息,識別所述多個文件包分巻是否屬於同組文件包分巻。17、根據權利要求16所述的系統,其特徵在於,所述信息獲取單元為網絡資源獲取單元,用於獲取各文件包分巻的頭信息,分析頭信息得到文件包分巻的所述識別信息。18、根據權利要求16所述的系統,其特徵在於,所述識別單元為列表識別單元,用於比較分巻號相鄰的文件包分巻的文件列表,如果分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;否則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。19、根據權利要求18所述的系統,其特徵在於,所述比較分巻號相鄰的文件包分巻的文件列表,包括獲取各文件包分巻的後續分巻屬性,該後續分巻屬性為生成文件包分巻時一併生成,如果一個文件包分巻的該屬性值為是,則該文件包分巻有後續分巻,如果該屬性值為否,則該文件包分巻為其所屬同組文件包分巻的最後一個文件包分巻;當一個文件包分巻的所述是否有後續分巻屬性為否時,則不將該文件包較。20、根據權利要求16所述的系統,其特徵在於,所述各文件包分巻的識別信息還包括所述文件包分巻的分巻大小。21、根據權利要求20所述的系統,其特徵在於,所述識別單元為綜合識別單元,用於當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性相同,並且,所述分巻號相鄰的文件包分巻的分巻大小相同時,則確定所述分巻號相鄰的文件包分巻屬於同組文件包分巻;當分巻號相鄰的文件包分巻中,分巻號較小的文件包分巻的文件列表中最後一個文件的文件屬性,與分巻號較大的文件包分巻的文件列表中第一個文件的文件屬性不相同,或者,所述分巻號相鄰的文件包分巻的分巻大小不相同時,則確定所述分巻號相鄰的文件包分巻不屬於同組文件包分巻。22、根據權利要求16至21中任一項所述的系統,其特徵在於,該系統進一步包括建立單元,用於建立屬於同組的各文件包分巻之間的關聯。23、根據權利要求22所述的系統,其特徵在於,所述建立單元包括CID計算子單元,用於根據預設算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;第一建立子單元,用於建立各文件包分巻的CID之間的對應關係。24、根據權利要求22所述的系統,其特徵在於,所述建立單元包括組籤名獲取子單元,用於獲得一個組籤名,所述組籤名為所述屬於同組的文件包分巻的共同標識;第二建立子單元,用於建立所述組籤名及所述屬於同組的各文件包分巻之間的關聯。25、根據權利要求24所述的系統,其特徵在於所述建立單元還包括CID計算子單元,用於根據預^L算法計算獲得屬於同組的各文件包分巻的內容籤名CID,所述CID用於唯一標識每一個文件包分巻;所述預設算法為對不同的二進位文件的內容數據進行處理能得到不同處理結果的算法;所述組籤名獲取子單元為GID生成子單元,用於才艮據所述CID,獲得所述文件包分巻所在組的組籤名GID;所述第二建立子單元為組建立子單元,用於建立所述組籤名GID及所述屬於同組的各文件包分巻CID之間的關聯。26、根據權利要求25所述的系統,其特徵在於所述GID生成子單元為GID第一子單元,用於選取屬於同組文件包分巻中分巻號最小的文件包分巻的CID作為該組文件包分巻的組籤名GID;或所述GID生成子單元為GID第二子單元,用於將所述屬於同組的各文件包分巻的內容籤名CID組合為一個CID集合,將根據所述預設算法計算所述CID集合得到的值,作為該組文件包分巻的組籤名GID。27、根據權利要求22所述的系統,其特徵在於,該系統還包括第一搜索單元,用於當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;及第一返回單元,用於根據所建立的屬於同組的各文件包分巻之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息排序在一起作為搜索結果返回。28、根據權利要求24所述的系統,其特徵在於,該系統還包括第二搜索單元,用於當用戶通過關鍵字搜索文件包分巻時,從預設的分巻相關信息與分巻搜索信息的對應關係中,查找與所述關鍵字匹配的分巻搜索信息;第二返回單元,用於根據所述組籤名及所述屬於同組的各文件包分巻的分巻相關信息之間的關聯,將查找到的與所述關鍵字匹配的分巻搜索信息中,屬於同組的多個文件包分巻的分巻相關信息對應的組籤名作為搜索結果返回;第三返回單元,用於當用戶選擇所述組籤名時,將所述組籤名所對應的屬於同組的各文件包分巻的分巻相關信息返回給用戶。29、根據權利要求22所述的系統,其特徵在於,該系統還包括第一下載單元,用於當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所述建立單元所建立的屬於同組的各文件包分巻之間的關聯,獲取並返回屬於同組的其他文件包分巻的分巻相關信息;或第二下載單元,用於當用戶下載屬於所述同組文件包分巻中的其中一個或多個文件包分巻時,根據所述建立單元所建立的屬於同組的各文件包分巻之間的關聯,獲取屬於同組的其他文件包分巻的存放地址,並建立下載任務。30、根據權利要求27至29中任一項所述的系統,其特徵在於,所述分巻相關^f言息為各文件包分巻對應的描述信息^或統一資源定位符URL存放地址。全文摘要本發明實施例公開了一種文件包分卷的識別方法及系統。所述文件包分卷識別方法包括獲取多個文件包分卷中的各文件包分卷的識別信息,所述識別信息包括所述各文件包分卷的分卷號與文件列表,所述分卷號為生成文件包分卷時各文件包分卷在同組文件包分卷中的序號,所述文件列表記錄了各文件包分卷所存儲文件的屬性信息;根據所獲取的各文件包分卷識別信息識別所述多個文件包分卷是否屬於同組文件包分卷。文檔編號G06F17/30GK101350837SQ20081021393公開日2009年1月21日申請日期2008年8月28日優先權日2008年8月28日發明者張國強,陳曉東申請人:深圳市迅雷網絡技術有限公司