新四季網

出版物的指紋提取方法、出版物的指紋提取裝置、利用指紋的出版物識別系統及利用指紋...的製作方法

2023-08-01 08:55:51 1

專利名稱:出版物的指紋提取方法、出版物的指紋提取裝置、利用指紋的出版物識別系統及利用指紋 ...的製作方法
技術領域:
本發明涉及內容識別,更具體的涉及出版物的指紋提取方法,出版物的指紋提取裝置,利用指紋的出版物識別系統及利用指紋的出版物識別方法。
背景技術:
包含有文本及圖像的內容或者數位化的出版物很容易被複製,從而通過網際網路或者P2P等各種方式進行非法傳播。上述非法傳播的內容對作者不僅造成了直接的經濟損失,而且是間接降低作者創作積極性的主要原因。為防止內容的非法傳播,並且保護著作權,使用了現有的如下技術:將內容包裝及加密化的數字版權保護技術(Digital Rights Management),以便在販賣或者購買內容時,購買行為發生在所認證的環境下;數字產權保護技術(Digital Property Protection),以便限制內容被存儲於硬碟或者拷貝;水印技術(watermarking),其在內容中插入不顯眼的販賣者或者著作權人的信息。圖1是表示適用內容數字版權加密保護技術等的保護裝置的一般內容保護方法的簡略圖。參照圖1,內容提供者(Contents Providers)利用原版內容和密鑰,從而將內容進行加密化及包裝後,對此進行提供,並且使用者通過訪問相應的數字版權加密保護技術伺服器,執行購買認證步驟,從而必須合法購買相應內容才能獲得解開加密的鑰匙和能夠使用相應內容的使用許可(license),由此可播放相應內容。如圖1所示,在現有的情況下,內容提供者通過使用數字版權加密保護技術等的加密化及包裝方式的保護方法,從而對著作權人的權利進行保護,現有的著作權保護方法以變形的形態發展並繼承了上述方法。現有的著作權保護方法使用加密化或包裝的方式對內容的著作權進行保護。但是對加密化的內容進行解讀或者將包裝的內容解開包裝時,內容可能會被非法傳播。例如,適用於特定電子書讀取裝置的數字版權加密保護技術被黑客攻擊後,用於上述電子書讀取裝置的電子出版物被無故非法傳播。此外,近來隨著數位相機,掃描設備,計算機等技術的發展以及圖像處理技術的發展,模擬或者數字出版物的複製更加簡便精巧,並且由此使用者以非法洩露模擬出版物或者數位化出版物為目的,從而生成數位化文件,並且進行傳播,在此情形之下,很難判斷其是否為非法傳播或者是否侵害了著作權。因此,根據現有的內容保護技術,適用保護功能的內容或出版物,即使由於使用者的惡意行為,導致保護功能解除的情況下,使用內容識別技術,從而能夠判斷是否侵害出版物的著作權,以及是否為非法傳播,需要能夠有效保護著作權的方法
發明內容
為克服上述缺點,本發明的目的在於,提供一種可輕易識別出版物的出版物的指紋提取方法,以便判斷是否侵害著作權,並且能夠有效地保護著作權。此外,本發明的另一個目的在於,提供一種執行上述出版物的指紋提取方法的指紋提取裝置。此外,本發明的又另一個目的在於,提供一種利用指紋的出版物識別系統,以便可易於識別出版物並且有效保護著作權。此外,本發明的又另一個目的在於,提供一種利用上述指紋的出版物識別系統的操作方法。根據用於實現上述本發明的目的的本發明的一個側面的指紋提取方法包括如下步驟:從所輸入的文本形式的電子文檔中提取文本;從上述提取的文本中提取文本指紋。從上述所輸入的文本形式的電子文檔中提取文本的步驟中,在對上述所輸入的文本形式的電子文檔執行預處理後,從上述所輸入的文本形式的電子文檔中提取文本。對於上述所輸入的文本形式的電子文檔的預處理可包括修正錯字或者還原文字。另外,根據用於實現本發明的目的的本發明的另一個側面的指紋提取方法包含如下步驟:輸入圖像形態的電子文檔;當所輸入的上述圖像形態的電子文檔為文本基礎的電子文檔時,將上述所輸入的圖像形態的電子文檔轉換為文本形態的電子文檔;從上述轉換的文本形態的電子文檔中提取文本;以及從上述所提取的文本中提取文本指紋。對上述圖像形態的電子文檔進行輸入的步驟可包括如下步驟:在輸入上述圖像形態的電子文檔後,對上述圖像形態的電子文檔執行預處理。執行對上述圖像形態的電子文檔的預處理的步驟中,可執行包括於上述圖像形態的電子文檔的雜音刪除、頁面分離、圖像旋轉及圖像的傾斜調整中至少一個處理。當上述所輸入的上述圖像形態的電子文檔是圖像基礎的電子文檔時,上述出版物的指紋提取方法還可包括如下步驟:執行對上述所輸入的圖像形態的電子文檔的預處理;以及從上述預處理所執行的圖像形態的電子文檔中提取圖像指紋的步驟。此外,根據用於實現本發明的另一目的的本發明的一個側面的指紋提取裝置包括:圖像文本轉換部,其將所輸入的圖像形態的電子文檔轉換為文本形態的電子文檔;文本提取部,其從上述文本形態的電子文檔中提取文本;以及指紋提取部,其從上述所提取的文本中提取文本指紋。上述出版物的指紋提取裝置還可包括有圖像預處理部,其對上述所輸入的圖像形態的文檔中所包含的雜音刪除、頁面分離、圖像旋轉及圖像的傾斜調整中執行至少一個處理。上述指紋提取裝置可從上述圖像預處理所提供的預處理圖像中提取圖像指紋。上述出版物的指紋提取裝置還可包括文本預處理部,其對從上述圖像文本轉換部所提供的上述文本形態的電子文檔或者所輸入的文本形態的電子文檔執行預處理後,提供至上述文本提取部。此外,根據用於實現本發明的又另一個目的的本發明的一個側面的利用指紋的出版物識別系統包括:指紋提取裝置,其用於提取原版出版物的指紋;出版物信息建立裝置,其將上述指紋提取裝置所提供的原版出版物的指紋與上述原版出版物的附加信息進行相關聯並存儲;以及資料庫管理系統(DataBase Management System),其用於存儲從上述原版出版物中所提取的指紋及上述原版出版物的附加信息。當上述原版出版物或者質疑出版物為文本形式的電子文檔時,上述指紋提取裝置在從上述文本形式的電子文檔中提取文本後,從所提取的文本中提取文本指紋,並且當上述原版出版物或者上述質疑出版物為圖像形態的電子文檔時,上述指紋提取裝置在將圖像形態的電子文檔轉換為文本形態的電子文檔後,從所轉換的文本形態的電子文檔中提取文本,並從所提取的文本中提取文本指紋。當上述原版出版物或者上述質疑出版物為圖像形態的電子文檔時,上述指紋提取裝置執行對上述圖像形態的電子文檔的預處理後,可從預處理所執行的圖像形態的電子文檔中提取圖像指紋。上述原版出版物的附加信息可包含有原版出版物的製作者、出版社、題目、摘要、發行日、國際標準書號、地址、電話號碼、傳真號碼中至少一個信息。此外,根據用於實現本發明的又另一個目的的本發明的另一個側面的利用指紋的出版物識別系統包括:指紋提取裝置,其提取對用於識別所收集的質疑出版物的指紋;指紋質疑裝置,其對與從上述指紋提取裝置所提供的上述質疑出版物的指紋相應的原版出版物的指紋進行質疑;資料庫管理系統(DataBase Management System),其將從原版出版物中所提取的指紋及上述原版出版物的附加信息進行存儲,並且對應於上述指紋質疑裝置的質疑,從而提供至少由一個原版出版物的指紋所構成的檢索結果候補群;以及候補群檢查裝置,其對上述資料庫管理系統所提供的檢索結果候補群進行檢查,從而判斷上述質疑出版物是否侵害著作權。上述候補群檢查裝置中,將上述檢索結果候補群與上述質疑出版物的指紋進行比較,並且以比較結果為基礎,可識別上述質疑出版物。當上述質疑出版物被判斷為資料庫管理系統中所存在的出版物時,上述候補群檢查裝置可從上述資料庫管理系統獲取並提供所屬於上述質疑出版物的附加信息。此外,根據用於實現本發明的又另一個目的的本發明的一個側面的利用指紋的出版物識別方法包含如下步驟:提取所收集的質疑出版物的指紋;與從上述所收集的質疑出版物中所提取的指紋相對應的原版出版物的指紋在資料庫管理系統中進行檢索;以及以至少一個檢索結果為基礎,識別上述所收集的質疑出版物是否侵害著作權。以上述至少一個檢索結果為基礎,識別上述所收集的質疑出版物的步驟中,將上述至少一個的檢索結果與上述質疑出版物的指紋進行比較的結果為基礎,可識別上述質疑出版物。當上述所收集的識別質疑出版物的結果被判斷為上述質疑出版物與原版出版物相同的情況下,上述利用指紋的出版物識別方法還可包含從上述資料庫管理系統中獲取與上述質疑出版物所相應的附加信息的步驟。根據如上所述的出版物的指紋提取方法、出版物的指紋提取裝置、利用指紋的出版物識別系統以利用指紋的出版物識別方法,利用原版出版物提取指紋,從而與出版物元數據信息進行聯繫並管理,並提取質疑出版物的指紋,從而可識別未知的出版物的信息。此夕卜,利用所識別的出版物的信息,從而可判斷出版物是否為非法傳播或是否侵害著作權。因此,將出版物直接鍵入或掃描,或者用數位相機拍下,從而轉換為數位化出版物的情況下,或者即使在數字版權保護等各種保護裝置解除,或系統管理者利用權限變形為與原版一致的數字出版物,從而進行非法傳播的情況下,也能便於進行識別,由此可減少出版物的非法散布或傳播,並可預防著作權侵害。此外,根據本發明的一個實施例的利用指紋的出版物識別系統中,將出版物的部分信息(例如,大概幾頁的出版物)輸入,可用於檢索原出版物的信息。


圖1是表示適用數字版權加密保護技術等的保護裝置的一般內容保護方法的簡略圖。圖2是表示用於保護出版物著作權的技術例。圖3是表示從電子文檔形態提取文本指紋的方法的流程圖。圖4是表示從圖像形態的出版物提取文本指紋的方法的流程圖。圖5是表示從圖像形態的出版物提取圖像指紋的方法的流程圖。圖6是表示根據本發明的一個實施例的出版物的指紋提取方法的流程圖。圖7是表示根據本發明的一個實施例的出版物的指紋提取裝置的結構的框圖。圖8是表示根據本發明的一個實施例的出版物識別系統的構成的框圖。圖9是表示根據本發明的另一個實施例的出版物識別系統的構成的框圖。圖10是表示根據本發明的一個實施例的出版物識別系統的出版物識別方法的流程圖。
具體實施例方式本發明可進行各種變更,並且可具有各種實施例,將特定實施例在圖中例示,並且進行詳細說明。但是務必理解為,這並不是將本發明限定於特定的實施例,而是包括於本發明的思想及技術範圍內的所有變更,均等物及代替物都包含在內。在本申請中所使用的用語僅為說明特定實施例而使用,並不是限定本發明。單數的表達如未在文章中明確表示其他意思,則也包括複數的表達。在本申請中,「包括」或者「具有」等用語是指定說明書中所記載的特徵、數字、步驟、操作、構成要素、配件或上述的組合的存在,不排除一個或一個以上的其他特徵、數字、步驟、操作、構成要素、配件,或以上的組合的存在,或者附加可能性。如未進行其他定義,包含技術上的或者科學上的用語,此處所使用的全部用語,在本發明所屬的技術領域內,與具備一般知識的人員的通常理解的意義相同。與一般所使用的,字典中所定義的相同的用語,務必理解為與相關技術文脈上所具有的的意義一致,並且在本申請中,如未明確定義,則不解釋為理想的或者過度形態的意義。以下參照附圖,對本發明的優選實施例進行詳細說明。在對本發明的說明中,為便於整體理解,對圖面中的同一構成要素使用同一參照標號,並且省略對同一構成要素的重複說明。用於非法傳播出版物的數位化方法大致可分為四種。第一:出版物製作者遺失了存儲出版物的存儲媒體,或者管理疏忽的情況,以數字文件形態提供給出版社的出版物文件被洩露的情況,或者數字版權加密保護技術被解除,從而文件洩露的情況等,通過上述造成原版內容洩露的情況。第二:使用者直接將書等形態的印刷出版物鍵入並數位化的情況。在此情況下,印刷出版物變為電子文檔形態,因此通過大量的印刷等可大量生產高品質的盜版出版物。第三:使用者將小說、雜誌或者漫畫書等形態的印刷出版物用掃描設備進行掃描並數位化的情況。此時,使用者將印刷的出版物拆分,使用掃描設備的自動輸入裝置,或者使用自動傳遞出版物的裝置,或者直接用手傳遞出版物,並且對印刷的出版物進行掃描後存儲為圖像形態,從而可完成出版物的數位化。第四:使用者利用數位相機將印刷的出版物拍照並數位化的情況。在此情況下,數位化的文件以圖像的形態存儲,根據拍照者的熟練程度可產生品質的差異。所以,需要應對如上所述的出版物非法傳播的四種數位化方法的著作權保護技術。圖2是表示用於保護出版物著作權的技術例。如圖2所示,用於保護出版物的著作權的技術可大致分為三種。首先,出版物中向讀者提供信息的方法大致有文本和圖像。文本是小說書等出版物傳達信息的主要方法,並且圖像是雜誌或者漫畫書等出版物傳達信息的主要方法。上述用於非法傳播出版物的數位化方法中的第一種及第二種方法是數位化為文本基礎上的電子文檔形態,因此電子文檔形態中需要以文本指紋為基礎的出版物識別技術。此外,上述用於非法傳播出版物的數位化方法中的第三種及第四種方法將出版物數位化為圖像形態。此時,數位化為圖像形態的出版物為類似於小說書等的文本基礎上的出版物時,圖像文件形態中需要以文本指紋為基礎的出版物識別技術,並且數位化為圖像形態的出版物為類似於雜誌或漫畫書等的圖像基礎上的出版物的情況下,圖像文件形態中需要以圖像指紋為基礎的出版物識別技術。此處,指紋作為表示有關內容或出版物的固有特徵信息,也被稱作特徵或DNA。圖3是表示從電子文檔形態中提取文本指紋的方法的流程圖。以下,在本發明的實施例中電子文檔形態是指,包含計算機等的信息處理裝置中利用各種文檔編製程序來編制,從而存儲為文本形態的文檔文件(例如,TXT、韓文文件、word文件、存儲為文本形態的PDF文件)。首先,如果在指紋提取裝置中輸入文本文檔(步驟310),則指紋提取裝置執行文本預處理(步驟320),以便能夠從所輸入的文本文檔中順利地提取文本。此處,如上述所述,所輸入的文本文檔可以是利用各種文檔編製程序來編制的電子文檔。此外,上述文本預處理過程中可包含有錯字修正,或者對誤差造成的非正常形態的文字進行復原的處理過程,並且不用必須執行,只在有需要的情況下選擇性地執行。此後,指紋提取裝置從為了提取指紋而通過文本預處理的文本文檔中只提取作為出版物的信息傳遞方法的文本(步驟330)。指紋提取裝置對通過步驟330的執行所提取的文本進行指紋提取,從而對文本基礎的電子文檔形態的出版物的指紋進行提取(步驟340 )。圖4是表示從圖像形態的出版物中提取文本指紋的方法的流程圖。首先,在指紋輸出裝置中輸入用掃描設備掃描或者用數位相機拍下的圖像文件形態的文檔(步驟410),指紋提取裝置對所輸入的圖像文件形態的文檔執行圖像預處理,以便能夠提高光學字符識別(Optical Character Recognition)性能。此處,圖像文件形態是指通過商用圖像瀏覽器所能夠顯示的形態,並且在對圖像形態的文檔適用光學字符識別的情況下,圖像預處理是對可能降低文本識別性能的要素進行處理的過程,可包括有刪除雜音、頁面分離、旋轉、傾斜調整等處理過程。此後,指紋提取裝置對預處理所執行的圖像文件形態的文檔進行光學字符識別,從而將圖像文件形態的文檔轉換為文本形態的電子文檔形態(步驟430)。此處,通過光學字符識別轉換為文本的電子文檔中,由於光學字符識別性能的局限性,可能包含有誤識別的非正常形態的文字(或雜音),因此需要用於除去上述非正常形態的文字(或雜音)的處理過程。因此,指紋提取裝置對通過步驟430的執行轉換的文本形態的電子文檔執行預處理過程(440),以便對如上所述的非正常形態的文字或雜音進行刪除。此後,指紋提取裝置從預處理的文本形態的電子文檔中提取文本(步驟450),並且對提取的文本進行文本指紋提取(步驟460)。優選地,步驟440至步驟460的文本預處理過程、文本提取過程以及文本指紋提取過程適應於步驟430中執行的光學字符識別的識別算法及性能而執行。換句話說,圖3所示的步驟320至步驟340分別與圖4所示的步驟440至步驟460執行相同的功能,圖3所示的指紋提取過程是對雜音較少的文本形態的電子文檔進行指紋提取,反之在圖4所知的指紋提取過程中,在將所輸入的圖像文件形態的文檔通過光學字符識別變換為文本形態的電子文檔後,進行指紋提取,所以根據光學字符識別的識別性能變換的電子文檔中包含雜音的概率會變高。因此,與執行圖3所示的指紋提取方法的指紋提取裝置相比,執行圖4所示的指紋提取方法的指紋提取裝置優選地使用更加抗雜音的指紋提取裝置,並且執行圖4所示的指紋提取方法的指紋提取裝置在使用抗雜音裝置的情況下,圖3所示的指紋提取過程可包含於圖4。圖5是表示從圖像形態的出版物中提取圖像指紋的方法的流程圖。如上所述,雜誌書或者漫畫書等出版物中,圖像是傳達信息的主要方法。所以,如上所述,的信息傳達方法,對於使用作為傳達信息的方法的圖像的出版物,為保護著作權而提取圖像指紋。參照圖5,首先,如果指紋提取裝置輸入通過掃描裝置掃描或者通過數位相機拍下的圖像形態文檔(步驟510),則執行預處理(步驟520),以便能夠從所輸入的圖像文檔中有效地提取指紋。此處,預處理過程包含將可能妨礙圖像指紋提取的要素進行刪除的過程,例如,可包含有雜音刪除、頁面分離、旋轉、傾斜調整等處理。此後,指紋提取裝置從預處理的圖像中提取圖像指紋(步驟530)。圖6是表示根據本發明的一個實施例的出版物的指紋提取方法的流程圖,其綜合上述圖2至圖5的內容。參照圖6,首先,如果在指紋提取裝置中輸入用於提取指紋的數位化的出版物,則指紋輸入裝置對所輸入的數位化出版物進行判斷(步驟610),判斷其為圖像文件或者是文本文件,圖像文件的情況下,執行對圖像的預處理(步驟620)。此處,圖像預處理在對圖像形態的文檔適用光學字符識別的情況下,作為將可能降低文本識別性能的要素,或者可能妨礙圖像指紋提取的要素刪除的過程,可包括有雜音刪除、頁面分離、旋轉、傾斜調整等處理過程。此後,指紋提取裝置判斷預處理的圖像是否為圖像形態的文本(步驟630),當判斷為圖像形態的情況下,執行光學字符識別,從而將圖像形態的文本轉化為文本形態的電子文檔(步驟640)。此處,通過光學字符識別轉化為文本的電子文檔中,由於光學字符識別過程中識別性能的局限性,可能包含有誤識別的非正常形態的文字(或雜音),所以需要用於除去上述非正常形態的文字(或雜音)的處理過程。指紋提取裝置對通過步驟640的執行而轉換為文本形態的電子文檔執行文本預處理過程(步驟650),上述文本預處理過程用於刪除如上所述的非正常形態的文字或雜音。之後,指紋提取裝置從預處理的文本形態的電子文檔中提取文本(步驟660),對提取的文本進行文本指紋提取(步驟670 )。此外,在圖6所示的步驟610中,將輸入有判斷結果的數位化出版物被判斷為文本文檔時,指紋提取裝置不執行步驟620至640,而進行步驟650,從而按順序執行步驟650至步驟670。此外,在圖6的步驟630中預處理的圖像不是圖像形態的文本,而是類似於雜誌或者漫畫等的圖像的情況下,指紋提取裝置不執行步驟640至670,而進行步驟680,並且從預處理的圖像中提取圖像指紋(步驟680)。圖7是表示根據本發明的一個實施例的出版物的指紋提取裝置的結構的框圖。參照圖7,根據本發明的一個實施例的指紋提取裝置(700)可包括有控制部(710)、圖像預處理部720、圖像-文本轉換部730、文本預處理部740、文本提取部750以及指紋提取部760。控制部710對所輸入的數位化出版物的種類進行判斷,根據判斷結果將所輸入的數位化出版物提供至圖像預處理部720,或者文本預處理部740。例如,控制部710當所輸入的出版物是通過掃描裝置掃描或者通過數位相機拍下的圖像形態的電子文檔時,提供至圖像預處理部,並且當所輸入的出版物是文本形態的電子文檔時,提供至文本預處理部740。此外,除上述功能外,控制部710還可控制構成指紋提取裝置的其他要素的操作。圖像預處理部720為能夠提高光學字符識別的識別性能,對控制部710所提供的圖像形態的電子文檔執行刪除雜音、頁面分離、旋轉、傾斜調整等處理後,對執行預處理的圖像種類進行判斷,在執行預處理的圖像是由文本構成的圖像形態的電子文檔的情況下,提供至圖像-文本轉換部730,在執行預處理的圖像是由類似於雜誌或漫畫等圖像構成的情況下,提供至指紋提取部760。圖像-文本轉換部730可由光學字符識別構成,從預處理部720中所提供的預處理的圖像轉換為文本形態的電子文檔後,將變換的文本形態的電子文檔提供至文本提取部750。文本預處理部740對從文本預處理部740或者控制部710中所提供的文本形態的電子文檔進行預處理,以便刪除非正常形態的文字或雜音後,將預處理的文本形態的電子文檔提供至文本提取部750。
文本提取部750接收到從文本預處理部740中預處理的文本形態的電子文檔,在所接收的電子文檔中提取作為出版物的信息傳達方法的文本後,提供至指紋提取部760。指紋提取部760從圖像預處理部720所提供的預處理的圖像中提取圖像指紋,或者從文本提取部750所提供的文本中提取文本指紋。此處,指紋提取部720利用周所周知的指紋提取技術,可從圖像或文本中提取指紋。具體說來,指紋提取部760可包括有圖像指紋提取模塊761,以及文本指紋提取模塊763,圖像指紋提取模塊761從圖像預處理部720所提供的預處理圖像中提取圖像指紋,並且文本指紋提取模塊763從文本提取部750所提供的文本中提取指紋。圖6及圖7所圖示的根據本發明的一個實施例的出版物的指紋提取方法及裝置可用於提取原版出版物的指紋,並且可用於提取通過網際網路檢索或收集的非法傳播出版物的指紋,並且還可以用於提取任意想要了解的出版物的指紋。此外,根據本發明的一個實施例的出版物的指紋提取方法及裝置也可以用於提取質疑出版物的指紋。圖8是表示根據本發明的一個實施例的出版物識別系統的構成的框圖,對如下系統進行舉例並示出:在為保護著作權從出版物著作權人或者出版物提供者接收出版物原版的情況下,利用出版物的指紋來建立資料庫。參照圖8,根據本發明的一個實施例的出版物識別系統可包括有指紋提取裝置700、出版物信息建立裝置810以及資料庫管理系統(DataBase Management System) 830。指紋提取裝置700具備如圖7所示的相同構成,並且執行圖6所示的指紋提取方法,從而提取原版出版物的指紋後,將所提取的原版出版物的指紋提供至出版物信息建立裝置810。出版物信息建立裝置810從指紋提取裝置700接收原版出版物的指紋,並且在從出版物著作權人或者出版物提供者接收原版出版物的信息後,將原版出版物的指紋和原版出版物的信息進行相關聯,從而提供至資料庫管理系統830,並進行管理。此處,原版出版物的信息可包含有原版出版物的製作者、出版社、題目、摘要、發行日、國際標準書號(International Standard Book Number)、地址、電話號碼、傳真號碼等與原版出版物相關的各種信息。此外,出版物信息建立裝置810可將原版出版物存儲於資料庫管理系統830中以便出版物的管理,並且在需要保密的情況下也可將出版物的整體或部分進行加密,從而存儲於資料庫管理系統830中。資料庫管理系統830將從出版物信息建立裝置810中所提供的原版出版物的指紋及與此相關的出版物信息進行存儲。此外,資料庫管理系統830根據出版物信息建立裝置810的提供,可將原版出版物存儲。圖9是表示根據本發明的另一個實施例的出版物識別系統的構成的框圖。數字出版物的文件或數位化的出版物文件能夠通過網際網路等輕易傳播。例如,出版物文件可通過類似於P2P、torrent、web hard、caf6、博客等各種網際網路途徑傳播。此外,由於數字文件的特性,數字出版物或數位化的出版物易於複製及移動,所以可通過便攜存儲裝置或便攜終端等進行傳播。圖9所示的根據本發明的另一個實施例的出版物識別系統用於對通過上述各種途徑非法傳播的出版物或侵害著作權的出版物進行識別,或者對想要了解的出版物進行識別。參照圖9,根據本發明的一個實施例的出版物識別系統可包括有指紋提取裝置700、指紋質疑裝置820、資料庫管理系統830、以及候補群檢查裝置840。指紋提取裝置700具備如圖7所示的相同構成,並且執行圖6所示的指紋提取方法。指紋提取裝置700為識別出版物的非法傳播或侵害著作權與否,對通過各種途徑檢索及收集的質疑出版物的指紋進行提取後,將所提取的指紋提供至指紋質疑裝置820。指紋質疑裝置820將從指紋提取裝置700所提供的質疑出版物的指紋向資料庫管理系統830進行質疑。此外,指紋質疑裝置820將從指紋提取裝置700所提供的質疑出版物的指紋提供至候補群檢查裝置840。資料庫管理系統830從指紋質疑裝置820中接收質疑出版物的指紋後,並在資料庫中檢索與此相對應的指紋後,將所檢索到的至少一個檢索結果候補群提供至候補群檢查裝置840。此處,上述檢索結果候補群可包含有至少一個與上述質疑出版物的指紋相類似的原版出版物的指紋,以及相應出版物的信息。候補群檢查裝置840對從資料庫管理系統830所提供的檢索結果候補群進行檢查,從而辨別質疑出版物的非法傳播或是否侵害著作權。例如,候補群檢查裝置840將從資料庫管理系統830所提供的檢索結果候補群與從指紋質疑裝置820所提供的質疑出版物指紋進行比較,從而可辨別質疑出版物的非法傳播或是否侵害著作權。此外,候補群檢查裝置840可從資料庫管理系統830獲取非法傳播或侵害著作權的出版物的信息,從而提供至相應機關或管理者。圖8及圖9所示的出版物識別系統中,指紋提取裝置在提取出版物的指紋時需要很多時間,因此可利用雲計算概念,將指紋提取裝置分散而構成,以便減少系統的負荷。此夕卜,可利用散列(hash)等技術,將一次檢索的文件分別處理,從而可利用防止重新檢索的過程的技術,以便提高出版物識別系統的性能,並且較少整體負荷。圖10是表示根據本發明的一個實施例的出版物識別系統的出版物識別方法的流程圖。參照圖10,首先,出版物識別系統將懷疑為非法傳播或侵害著作權的出版物作為質疑出版物進行檢索及收集(步驟1010),並提取所收集的質疑出版物的指紋(步驟1020)。此後,出版物識別系統將對應於所提取的指紋的出版物向資料庫管理系統進行質疑(步驟1030),從而從資料庫管理系統中獲取相應檢索結果候補群(步驟1040)。此處,從資料庫管理系統中所獲取的檢索結果候補群可包含至少一個與質疑出版物的指紋相對應的出版物的指紋。此後,執行對出版物識別系統所獲取的檢索結果候補群的檢查,從而識別判斷為非法散布(或傳播)或者侵害製作權的相應的出版物(步驟1050)。此處,出版物識別系統以將通過步驟1020的執行所提取的指紋與從資料庫管理系統所提供的指紋進行比較的結果作為基礎,從而可識別相應出版物。此後,出版物識別系統從資料庫管理系統中獲取非法傳播或著作權侵害的出版物的信息,從而提供所獲取的信息(步驟1060)。如上所述,根據本發明的一個實施例的出版物識別系統,對預先要求著作權保護的出版物,利用原版出版物提取指紋,從而與出版物元數據信息進行相關聯並管理,從而構築用於保護出版物的識別及著作權的系統,並且可利用出版物的指紋,對非法傳播或侵害著作權的出版物進行識別,從而保護著作權。此外,本發明在利用指紋來解除加密及包裝方法的情況下,切斷非法傳播,並且事後相應出版物在網上無故傳播的情況下,能夠採取切實的保護措施。此外,根據本發明的一個實施例的利用指紋的出版物識別系統,輸入出版物的部分信息(例如,大概幾頁的出版物),也可使用為檢索原出版物的信息的目的。其可通過根據本發明的一個實施例的出版物識別系統利用指紋而實現,上述指紋利用表示有內容固有的信息的特點。雖為參照上述實施例進行的說明,相關技術領域的熟練從業者不脫離以下權利要求範圍所記載的本發明的思想及領域,可對本發明進行多種修正及變更。
權利要求
1.一種出版物的指紋提取方法包括如下步驟: 從所輸入的文本形式的電子文檔中提取文本;以及 從上述所提取的文本中提取文本指紋。
2.根據權利要求1所述的出版物的指紋提取方法,其特徵在於: 從上述所輸入的文本形式的電子文檔中提取文本的步驟中,在對上述所輸入的文本形式的電子文檔執行預處理後,從上述所輸入的文本形式的電子文檔中提取文本。
3.根據權利要求2所述的出版物的指紋提取方法,其特徵在於: 對上述所輸入的文本形式的電子文檔的預處理包括錯字修正或文字復原。
4.一種出版物的指紋提取方法包括如下步驟: 輸入圖像形態的電子文檔; 在所輸入的上述圖像形態的電子文檔為文本基礎的電子文檔的情況下,將上述所輸入的圖像形態的電子文檔轉換為文本形態的電子文檔; 從上述所轉換的文本形態的電子文檔中提取文本;以及 從上述所提取的文本中提取文本指紋。
5.根據權 利要求4所述的出版物的指紋提取方法,其特徵在於,輸入上述圖像形態的電子文檔的步驟還包括如下步驟: 在輸入上述圖像形態的電子文檔後,執行對上述圖像形態的電子文檔的預處理。
6.根據權利要求5所述的出版物的指紋提取方法,其特徵在於: 執行對上述圖像形態的電子文檔的預處理的步驟中,執行上述圖像形態的電子文檔中所包含的刪除雜音、頁面分離、圖像旋轉、傾斜調整中至少一個處理。
7.根據權利要求4所述的出版物的指紋提取方法,其特徵在於,當上述所輸入的上述圖像形態的電子文檔為圖像基礎的電子文檔的情況下,上述出版物的指紋提取方法還包括如下步驟: 執行對上述所輸入的圖像形態的電子文檔的預處理;以及 從上述執行預處理的圖像形態的電子文檔中提取圖像指紋。
8.根據權利要求4所述的出版物的指紋提取方法,其特徵在於: 從上述所轉換的文本形態的電子文檔中提取文本的步驟中,在執行對上述所轉換的文本形式的電子文檔的預處理後,從上述所轉換的文本形式的電子文檔中提取文本。
9.一種出版物的指紋提取裝置,其包括: 圖像文本轉換部,其將所輸入的圖像形態的電子文檔轉換為文本形態的電子文檔; 文本提取部,其從上述文本形態的電子文檔中提取文本;以及 指紋提取部,其從上述所提取的文本中提取文本指紋。
10.根據權利要求9所述的出版物的指紋提取裝置,其特徵在於,上述出版物的指紋提取裝置還包括: 圖像預處理部,其對上述所輸入的圖像形態的文檔中所包含的雜音刪除、頁面分離、圖像旋轉及圖像的傾斜調整中執行至少一個的處理。
11.根據權利要求10所述的出版物的指紋提取裝置,其特徵在於: 上述指紋提取部中,從上述圖像預處理所提供的預處理圖像中提取圖像指紋。
12.根據權利要求9所述的出版物的指紋提取裝置,其特徵在於,上述出版物的指紋提取裝置還包括: 文本預處理部,其對上述圖像文本轉換部所提供的上述文本形態的電子文檔或者所輸入的文本形態的電子文檔執行預處理後,提供至上述文本提取部。
13.一種利用指紋的出版物識別系統,包括: 指紋提取裝置,其用於提取原版出版物的指紋; 出版物信息建立裝置,其將上述指紋提取裝置所提供的原版出版物的指紋與上述原版出版物的附加信息進行相關聯並存儲;以及 資料庫管理系統(DataBase Management System),其用於存儲從上述原版出版物中所提取的指紋及上述原版出版物的附加情報。
14.根據權利要求13所述的利用指紋的出版物識別系統,其特徵在於: 當上述原版出版物或者質疑出版物為文本形式的電子文檔時,上述指紋提取裝置在從上述文本形式的電子文檔提取文本後,從所提取的文本中提取文本指紋,並且當上述原版出版物或者上述質疑出版物為圖像形態的電子文檔時,上述指紋提取裝置在將圖像形態的電子文檔轉換為文本形態的電子文檔後,從所轉換的文本形態的電子文檔中提取文本,並從所提取的文本中提取文本指紋。
15.根據權利要求14所述的利用指紋的出版物識別系統,其特徵在於: 當上述原版出版物或者上述質疑出版物為圖像形態的電子文檔時,上述指紋提取裝置執行對上述圖像形態的電子文檔的預處理後,可從預處理所執行的圖像形態的電子文檔中提取圖像指紋。
16.根據權利要求13所述的利用指紋的出版物識別系統,其特徵在於: 上述原版出版物的附加信息可包括有原版出版物的製作者、出版社、題目、摘要、發行日、國際標準書號、地址、電話號碼、傳真號碼中至少一個信息。
17.一種利用指紋的出版物識別系統,其包括: 指紋提取裝置,其從用於識別著作權侵害而所收集的質疑出版物中提取指紋; 指紋質疑裝置,其將所屬於從上述指紋提取裝置所提供的上述質疑出版物的指紋的原版出版物的指紋進行質疑; 資料庫管理系統(DataBase Management System),其將從原版出版物中所提取的指紋及上述原版出版物的附加信息進行存儲,並且對應於上述指紋質疑裝置的質疑,從而提供由至少一個原版出版物的指紋所構成的檢索結果候補群;以及 候補群檢查裝置,其對上述資料庫管理系統所提供的檢索結果候補群進行檢查,從而判斷上述質疑出版物是否侵害著作權。
18.根據權利要求17所述的利用指紋的出版物識別系統,其特徵在於: 上述候補群檢查裝置中,將上述檢索結果候補群與上述質疑出版物的指紋進行比較,以比較結果為基礎,識別上述質疑出版物,當上述質疑出版物被判定為資料庫管理系統中所存在的出版物時,可從上述資料庫管理系統中獲取所屬於上述質疑出版物的附加信息而提供。
19.一種利用指紋 的出版物識別方法,包括如下步驟: 提取所收集的質疑出版物的指紋; 與從上述收集的質疑出版物中所提取的指紋相對應的原版出版物的指紋在資料庫管理系統中進行檢索;以及 以至少一個檢索結果為基礎,識別上述所收集的質疑出版物。
20.根據權利要求19所述的利用指紋的出版物識別方法,其特徵在於,以上述至少一個檢索結果為基礎,識別上述所收集的質疑出版物的步驟還包括如下步驟: 以將上述至少一個檢索結果與上述質疑出版物的指紋進行比較的結果為基礎,可識別上述質疑出版物,當上述所收集的識別質疑出版物的結果被判斷為上述質疑出版物與原版出版物相同的情況下,從上 述資料庫管理系統中獲取對應於上述質疑出版物的附加信息。
全文摘要
本發明涉及出版物的指紋提取方法、出版物的指紋提取裝置、利用指紋的出版物識別系統及利用指紋的出版物識別方法,其能夠易於識別是否侵害著作權,並且能夠有效地保護著作權。利用指紋的出版物識別系統包括指紋提取裝置,其提取用於識別著作權侵害所收集的質疑出版物的指紋;指紋質疑裝置,其對所屬於從指紋提取裝置中所提供的質疑出版物的指紋的原版出版物的指紋進行質疑;資料庫管理系統,其將從原版出版物中所提取的指紋及原版出版物的附加信息進行存儲,並且呼應上述指紋質疑裝置的質疑,從而提供由至少一個原版出版物的指紋所構成的檢索結果候補群;以及候補群檢查裝置,其對資料庫管理系統所提供的檢索結果候補群進行檢查,從而判斷質疑出版物是否侵害著作權。由此,可易於識別是否侵害出版物的著作權,並且通過此刻預防著作權的侵害。
文檔編號G06F21/16GK103154957SQ201180049463
公開日2013年6月12日 申請日期2011年10月13日 優先權日2010年10月14日
發明者尹英錫, 樸智顯, 李相光, 金貞玄, 徐泳浩, 徐庸碩, 李承宰, 金成敏, 李廷浩, 俞元英 申請人:韓國電子通信研究院

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀