新四季網

一種亞洲文字圖像的混洗方法及混洗處理系統的製作方法

2023-12-06 12:20:31 2

專利名稱:一種亞洲文字圖像的混洗方法及混洗處理系統的製作方法
技術領域:
本發明涉及一種亞洲文字圖像(image)的混洗(Shuffle)方法及混洗處理系統,特別是涉及一種用亞洲文字所寫秘密文件的內容意義不被第三者所知曉的混洗方法及混洗處理系統。
背景技術:
將亞洲文字(漢字、假名、韓文(hangeul)等,稱在亞洲地域所使用的文字)所寫文件(以下稱「亞洲文件」)用圖像掃描設備等掃描,將文件作為映像(圖像)數據收進計算機,將所獲得圖像分為文字(character)部分與非文字部分,但是至今仍不存在僅混洗(或混組,Shuffle)文字圖像部分(即,分散文字圖像的順序來替換)的技術。
亞洲文件由連續為一連串亞洲文字(大致為正方形)所構成。亞洲文字雖具有作為文字單體的意義,但作為連續的文字(sentence,熟語或語句)具有一個意義,也有出現歧義的情況。
欲變換由這些亞洲文字所構成的亞洲文件的文字圖像為文本數據(textdata)(以下稱為文本化)時,通常是用圖像掃描設備讀取其亞洲文件來進行成像,將其用OCR軟體文本化,但現在的OCR軟體的識別率(能變換為正確文本數據的比率)不會成為100%,因此,人為的修正成為不能缺少的一部分。在這些亞洲文件不是秘密文件時,也可以將包含該修正作業的文本化操作委託給外部的第三者,但文件內容若為高秘密性內容,就不能原原本本將此委託給第三者。
如果對原來的文件文字進行了混洗(或混組),則混洗後的新文件(作為文字)雖可讀,但變得不能正確理解其原來的意義。例如,將原文件的第1、第3、第5而且第4的文字,分別交換為第2行的第1、第3、第5而且第4的文字的情況。換句話說,混洗用亞洲文字文件,雖作為文字單體可讀,但混洗後的新的文件就會完全地變為沒有意義。對文件的文字有時候還可進行多次的混洗。
於是混洗文字圖像,將文字的順序作成分散狀態,將其文本化委託給第三者,由委託者將經變換的文本數據恢復其原文字的順序,就可以使第三者無法獲知其內容,因此成為秘密文件可文本化。
並且,將映像化亞洲文件通過通信方式原樣傳送給對方時,存在會有他人接收的顧慮,因此,就不能保持文件的秘密性。在此狀況下,發送做了混洗的經映像化文件的文字圖像,即使有他人接收文件的情況發生,也會消除文件內容被第三者所知曉的顧慮,正當的接收者依預先規定的重混洗方法使文字圖像返回原來的行,即可獲知文件內容。換句話說,發送側的混洗,相當於是分散文件的文字順序的密碼化方法,在接收側的重混洗,相當於使傳送過來的文件的文字的行返回原來的解碼方法。
然而,依計算機自動實行混洗該文字圖像時有一個問題。也就是,對於在人的眼睛亞洲文字識別正方形的字塊為一個文字,電腦不管如何將文字作為映像(圖像)來把握,所以具有一個獨立意義的一個文字(例如,圖1的「休」),由分離的兩個部分(圖1的「亻」與「木」所成立時,將此不識別為稱1個「休」的文字,有分割為稱「亻」的圖形(外框1所圍繞部分)與稱「木」的圖形(外框200所圍繞部分)來識別的問題。而且在電腦中,將有「亻」的地方例如作為外框100的頂點坐標儲存,將有「木」的地方,例如作為外框200的頂點坐標儲存。因而,按照分割的原樣另外作混洗,則經混洗後就不成立其為文字,產生有不能文本化使用OCR文字的問題。
不用說,在上述二個部分之間如無間隙的文字時,(例如其中含有分離為一個以上的非正方形字塊,或/又重疊有用多個外框圍繞的部分時)外框已經成為正方形,變成作為一個文字所識別。例如於圖2稱為「復」的文字時,圍繞稱為「復」文字全體的正方形的框300中,因完全含有圍繞小「丿」的四角形的框400,所以此情況作為一個文字來識別。又與圖1同樣為稱「休」的文字,就如圖3所示為粗字體的「休」時,在「亻」與「木」之間無間隙,所以從開始就作為一個文字來識別。
於是如上述欲混洗由分離為二個以上的部分所成立的亞洲文字圖像時,構成其文字的各部分來個別地移動,所以如作為一體來移動,就變成需要依計算機標識文字(用漢字為例來講,不做分散「邊」與「右偏旁」作為單獨的文字來識別,一體的當作一個漢字識別)抽出的技術。反過來講,亞洲文字圖像的混洗是否會成功,要依賴於依計算機是否可將亞洲文字圖像進行標識抽出。

發明內容
針對有關計算機在文字識別的問題,本發明的目的是在於提供一種用於計算機的亞洲文字圖像的混洗方法及混洗處理系統,通過混洗經圖像化的文字,使混洗後的文字圖像的文本化正確進行,並根據圖像解析方法可將文中的文字正確地標識出來。
為了實現上述目的,本發明提供了一種亞洲文字圖像的混洗方法,混洗經掃描的亞洲文件的文字圖像,以無規則地改排而製作新的亞洲文件,其特徵在於,該方法包含有如下步驟a)掃描亞洲文件而接收其圖像的步驟;b)將該接收的亞洲文件圖像,分割為文字圖像部分與非文字圖像部分的步驟;c)對該文字圖像部分,構築多解析度位級的樹結構的步驟;d)由解析該多解析度位級的樹結構,抽出可混洗的文字圖像的島的步驟;e)混洗以無規則地選擇含一個或一個以上文字圖像字塊的可混洗的島,使重混洗經該混洗的島返回原來位置的步驟;及f)合併經該重混洗的文字圖像部分與所述非文字圖像部分,作為完全的原來亞洲文件的步驟。
為了更好地實現上述目的,本發明根據上述亞洲文字圖像的混洗方法,構築多解析度位級的樹結構的方法,其特徵在於,更具有以下步驟的亞洲文字圖像的混洗方法i)通過稀疏解析度使文字圖像形成全點圖像,從而構築文字圖像的多解析度塔式結構的步驟;ii)從各解析度位級的塔式(pyramid)結構中,找出所有島的步驟;iii)在塔式結構的各位級間構築所述樹結構各節點的主和次關係的步驟;及iv)使各個位置信息與尺寸信息,持於樹結構各位級的節點的步驟。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗方法,為上述的亞洲文字圖像的混洗方法,其特徵在於,2(j-1)×2(j-1)解析度位級是在圍繞1點的周圍而塗滿,在2j×2j的解析度位級構成1點,所述島被定義為由塗滿4連結所結合的圖像字塊的外框,2j×2j位級與2(j-1)×2(j-1)位級構成節點上的主和次關係,在2j×2j位級的主節點的島,包含所有在2(j-1)×2(j-1)位級的島或次節點。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗方法,為上述的亞洲文字圖像的混洗方法,其特徵在於,所述島的混洗方法更具有以下步驟a)為了配置做混洗的文字島製作空空間的步驟;b)將做混洗的文字島以無規則地選擇每一個,轉移其在該空空間,用該文字島填充所有空空間的步驟;及c)在經混洗的文字島,將做混洗前所掃描的文字島位置坐標作為屬性持有的步驟。
上述的亞洲文字圖像的混洗方法,其特徵在於,為了使經混洗的文字島返回原來位置實行重混洗,使用經混洗的文字島具有作為屬性的原文字島的位置坐標。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗方法,是根據上述方法中將經掃描的亞洲文件分為文字圖像部分與非文字圖像部分的步驟,其特徵在於,該步驟更具有以下步驟a)使用從經掃描的文件分離亞洲文字圖像部分的成像前處理技術步驟;b)對文本文字圖像或前景圖像,使用僅含文字圖像的成像步驟;及c)使用背景圖像的僅含非文字圖像的成像步驟。
上述的亞洲文字圖像的混洗方法,其特徵在於,該成像前處理技術,為實行傾斜校正、除去噪聲、網格線檢測、非文字圖像檢測。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗處理系統,用於混洗經掃描的亞洲文件的文字圖像,經無規則地改排以製作新的亞洲文件,其特徵在於,所述系統包含如次的裝置一用於掃描亞洲文件而接收其圖像的圖像輸入裝置;一用於將所輸入的亞洲文字圖像,分割為文字圖像部分與非文字圖像部分的裝置;
一用於對該文字圖像部分,構築多解析度位級的樹結構的裝置;一用於由解析該多解析度位級的樹結構,抽出可能混洗的文字圖像的島的裝置;一用於以無規則地選擇含一個或一個以上文字圖像可混洗的島進行混洗,重混洗該經混洗的島而返回原來位置的裝置;及一用於合併該經重混洗的文字圖像部分與所述非文字圖像部分,作為完全的原亞洲文件的裝置。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗處理系統,是上述的亞洲文字圖像的混洗處理系統,其特徵在於,對構築亞洲文字圖像的多解析度位級的樹結構的裝置更具有以下的裝置一用於通過稀疏解析度使文字圖像形成全點圖像,從而構築文字圖像的多解析度塔式結構的裝置;一用於從各解析度位級的塔式結構中,找出所有島的裝置;一用於在塔式結構的各位級間,構築樹結構各節點的主和次關係的裝置;及一用於使樹結構各位的節點,持有各個位置信息與尺寸信息的裝置。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗處理系統,為上述的亞洲文字圖像的混洗處理系統,其特徵在於,在2(j-1)×2(j-1)解析度位級塗滿圍繞1點的周圍,構成在2j×2j解析度位級的1點,所述島被定義為由塗滿4連結所結合的圖像字塊外框,2j×2j位級與2(j-1)×2(j-1)位級構成節點上的主和次關係,在2j×2j位級的主節點的島,包含所有在2(j-1)×2(j-1)位級的島或次節點。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗處理系統,其特徵在於,所述島的混洗裝置更具有以下裝置一用於給欲混洗的文字島形成空空間的裝置;一用於以無規則地選擇每一個做混洗的文字島,將其轉移到該空空間,用該文字島填充所有的空空間的裝置;及一用於使經混洗的文字島,持有將做混洗前所掃描文字島的位置坐標作為其屬性的裝置。
上述的亞洲文字圖像的混洗處理系統,其特徵在於,為了使經混洗的文字島返回原來位置而實行重混洗,使用經混洗的文字島作為屬性所具有原文字島的位置坐標。
為了實現本發明的上述目的,本發明還提供了一種亞洲文字圖像的混洗處理系統,為上述的亞洲文字圖像的混洗處理系統,具有將經掃描的亞洲文件分為文字圖像部分與非文字圖像部分的裝置,其特徵在於,所述裝置更具有以下裝置一用於從經掃描的文件中分離亞洲文字圖像的成像前處理裝置;一用於對文本文字圖像或前景圖像,使用僅含文字圖像的裝置;及一用於使用背景圖像僅含非文字圖像的成像裝置。
上述的亞洲文字圖像的混洗處理系統,其特徵在於,該成像前處理裝置為傾斜校正、除去噪聲、網格線檢測或非文字圖像檢測裝置。
為了實現本發明的上述目的,本發明還提供了一種可計算機讀取的記錄媒體,記錄有為了控制計算機的程序,其特徵在於,所述程序是該計算機將經掃描的亞洲文件的文字圖像進行混洗及重混洗,依下述步驟所實行的程序a)掃描亞洲文件,將獲得的圖像分為文字圖像部分與非文字圖像部分的步驟;b)對所述文字圖像,構築多解析度位級的樹結構的步驟,該步驟還包括以下步驟i)解析度位級20×20、21×21、22×22、、、與至全點為止變化文字多解析度的解析度,構築文字圖像的解析度塔式結構的步驟;ii)在各解析度位級的圖像之中,判斷連結有點的為一個島,並檢測所有島的步驟;iii)在成塔式結構的各解析度位級間,構築島的樹結構節點的主和次關係的步驟;iv)將各個前一個位級的島位置信息及尺寸信息作為屬性儲存的步驟;c)混洗亞洲文字圖像,又進行重混洗的步驟。
以下結合附圖和具體實施例對本發明進行詳細描述,但不作為對本發明的限定。


圖1為亞洲文字的組成說明圖;圖2為文字島的概念說明圖;圖3為作為一體所識別的亞洲文字的例圖;圖4為本發明亞洲文字圖像混洗系統的組成區段圖;圖5為本發明亞洲文字圖像混洗方法(系統)的流程圖;圖6為構築多解析度位級的樹結構方法的流程圖;圖7為多解析度位級的塔式體結構及樹結構的一實施例示意圖;圖8為一般的多解析度的塔式結構示意圖;圖9a-圖9d為說明「4連結」法的示意圖;圖10a-圖10d為說明「8連結」法的示意圖;圖11為混洗方法一實施例的流程圖;圖12為亞洲文件一實施例的示意圖;圖13為對圖12的圖像進行前處理後的圖像示意圖;圖14為混洗後的亞洲文字圖像的一實施例。
其中,附圖標記100、200、300、400-外框;11-亞洲文件(紙媒體);20-亞洲文字混洗處理系統;21-圖像掃描設備;22-計算機(個人計算機);30-網絡;40、50-第三者終端;具體實施方式
為更好說明本發明的技術特點、結構和所能實現的技術效果,下面結合附圖進一步詳細說明。
請參閱圖4,為本發明包含亞洲文字圖像的混洗處理系統全體結構的示意圖。由用亞洲文字所寫的紙媒體為亞洲文件11,利用圖像掃描設備21作為圖像資料輸入到計算機22的存儲裝置內,以儲存在計算機22的亞洲文字圖像的混洗處理程序,混洗文字圖像。該經混洗的亞洲文字圖像通過網絡30,發送給文本化該文字圖像的第三者終端40。在第三者終端40儲存有OCR軟體,經混洗的亞洲文字圖像變換為文本數據。該文本數據通過網絡30送給發送原計算機22,進行重混洗(使其返回原來文字位置)。並以圖像掃描設備21、計算機22及亞洲文字圖像的混洗處理程序,構成具有亞洲文字圖像的混洗處理系統20。欲將高秘密性的亞洲文件通過網絡30發送對方時,用儲存有重混洗程序的第三者終端50接收,用該重混洗程序進行重混洗,就可以傳達正確的文件內容。反過來講,在第三者終端50未儲存有重混洗程序時,則不能進行重混洗,所以通信線路上有旁接收時,其內容也不會被第三者所獲知。
請參閱圖5,為本發明亞洲文字圖像混洗方法的流程圖。首先,步驟S10,用圖像掃描設備21讀取記載有將實行混洗的文字的亞洲文件11(參照圖12),接收圖像。其接收的圖像分為含文字部分與不含文字部分(像片或圖形等),步驟S20,所以將此分為文字部分與非文字部分。之後,根據需要進行前處理。在此所謂的前處理,是指欲進行掃描時,因為紙的傾斜而讀取傾斜的行時,為消去其傾斜的傾斜校正;或因附著有灰塵或髒物,使其作為文字圖像的一部分被讀取,為此要去除該類噪聲;或如文字附著有網格線或下線時,要預先實行網格線檢測使其不視為文字的一部分而將其加以去除。這些前處理,可利用OCR軟體等功能來實現。請參閱圖13,為對圖12的圖像進行前處理後的圖像示意圖。
其次,對於通過步驟S20獲得的文字圖像,構築多解析度位級的樹結構的數據結構(步驟S30)。如上述,欲混洗由分離的二個以上部分所構成的亞洲文字圖像時,構成其文字的各部分無需個別地移動,以一體做移動,使得計算機標識(identify)文字以可抽出的形式存在。因此以階段的稀疏所輸入的文字圖像的解析度,對文字進行加粗,直到該分離的二個以上的部分間無間隙為止。間隙消失時,計算機就能標識(也即識別為1個文字)由該分離的二個以上部分所構成的亞洲文字圖像。在最終的作混洗的文字圖像為用圖像掃描設備輸入時的文字圖像,所以需要儲存在稀疏解析度前狀態的文字圖像屬性(尺寸、位置)信息。
於是,欲在計算機內儲存文字圖像的屬性時,在文字圖像中,用線框圍繞連接有線的最大尺寸的字塊外側,將其命名為島(island),用該外框的坐標表示島的位置。通常使用對角線上的坐標。用圖1中的「休」字為例,分別用外框100、外框200所圍繞的「亻」及「木」成為島。在圖2中,以外框300或外框400所圍繞的部分為島,但外框400所圍繞的島包含外框300所圍繞的島。又如圖3中,以休單獨為一個島。
請再參閱圖6,將步驟S30再分為更詳細的步驟,以下,按照圖6加以說明。
首先,由於以階段性進行稀疏解析度,使讀取的原件的文本文件圖像(圖7中(a)行、(b)行)成為全點圖像(塗滿所有狀態的狀況),構築文字圖像的多解析度塔式結構(步驟S31)。
在此所謂塔式(或角錐)結構,是在計算機圖像處理的領域所使用的層次結構的一個數據結構,對由2k×2k像素所成圖像,想為將不同解析度(解晰度)(20×20-2k×2k)K+1枚圖像的層次的集成,例如,用如圖8的形狀表現。也就是說,從輸入圖像I0出發,依序將像素數縱橫同時成1/2的圖像I1、I2…進行陸續的產生。反過來講,使圖像全體的大小為一定時,1點的大小變成為4倍,因此解析度下降。
本發明實施例中的上述Ik-1與Ik關係,請參閱圖9a至圖9d或圖10a至圖10d。首先,圖9a至圖9d所示為「4連結」法,將作為輸入圖像的圖9a的1像素(pixel)上下左右(即「4連結」)塗滿,製作21×21位級的圖像(如圖9b)。其次,將此經「4連結」的像素視為新的1點,以此為中心在上下左右連結21×21位級的點。這樣就完成22×22位級的圖像(如圖9c)。以下,以同樣的方法形成23×23位級(如圖9d)、24×24位級(如圖9e)的圖像,構築多解析度位級的塔式結構。圖10a-圖10d是對圖9a-圖9d的「4連結」,表示加上上下左右再加左右的斜方向的「8連結」法。基本的方法與「4連結」相同,因此省略說明。
其次,步驟S32,從步驟S31構築的塔式結構的各解析度位級圖像字塊中,抽出上述的島。島為圍繞連結圖像字塊的最大框,所謂抽出島,是將其外框的坐標儲存在計算機內。
其次,將在前步驟獲得的每一個解析度位級的島屬性信息,作樹結構的數據結構,對樹結構的各節點(結節點)構築主和次關係(步驟S33)。用圖7對此進行具體地說明,使輸入圖像的解析度低時,線就漸漸地變粗,因相鄰的島成為一個來生成新的島,所以在2k×2k位級的島變成為一定包含在2(k-1)×2(k-1)的島。具體的變成參見圖7,在圖7中(f)行的島1,包含一個下位級的島2、3、4,(e)行的島2,包含其下一位級的島5、6、7的關係。如此的關係是適於使用樹結構的數據構造。在圖7的實施例中,島1成為在樹結構的根(root)節點,下一位級的島2成為島1的次節點,同時亦成為對應於位級2的島5、6、7節點(次)的主節點。作成如此,設置對應在各島的節點,以構築對於其的主和次關係。
如此,對應於各解析度位級島的節點構築了主和次關係,步驟S34,將對應於次節點島的屬性信息(位置及尺寸)儲存在各主節點。具體地說,圖7中在級位4的島9及10的屬性信息儲存於島8的節點。由此,計算機即可知道島8由島9與島10所構成。
可以觀察到,圖7的島2為以3個文字所做出,但計算機只能把握為1個字塊。但是,亞洲文字大致為正方形,所以由於計算橫寬與縱長度之比就可推定其個數。
其次,步驟S40,由於解析上述多解析度位的樹結構,抽出可混洗的文字字塊(島)。具體的在屬於樹結構的根節點的島〔如圖7中(f)行的島1〕,通過計算推定有幾個可混洗的文字。在圖7中,因含有讀點「、」,因此變成半端的數,但由於將其下的位級(level 1)通過解釋樹結構來追尋下去,島4與其他可認為極端的較小。於是將此從混洗對象除掉,以剩餘的4個作為混洗的對象。
其次,步驟S50,以無規則的選擇實行混洗的文字島,進行混洗。雖然有各種各樣的混洗方法,但在這裡以其中一個作為實施例,請參閱圖11,為此實施例的流程圖。首先,步驟S51,形成配置給所要進行混洗的文字圖像的空空間。接著步驟S52,將各個進行混洗的文字圖像進行無規則的選擇,將其放入前一步驟所形成的空空間,用文字圖像填充全部空空間。需要做移動的文字圖像的島,是使用輸入圖像的位(如圖7中的位4),步驟S53,同時將其位置信息作為屬性來持有。其在進行重混洗而恢復原來位置時所必要。請參閱圖14,為混洗圖13中文字圖像後的文字圖像。可知單獨的文字可以判讀,但整體文字就不能具有其意義。
以上過程之後就能混洗亞洲文字圖像,但依OCR結束文本化等作業時,需要將此再返回至原來位置。在此狀況下,步驟S60,利用經混洗的文字島的位置信息返回。最後,步驟S70,結合經重混洗的文字圖像部分與非文字圖像部分,將原來的亞洲文件復原。
雖然本發明的文字混洗技術,以亞洲文字為對象,但也可以適用於如字母的歐美各國所使用的文字上。
如上所述,本發明的亞洲文字圖像的混洗方法及混洗處理系統,是對文字圖像進行混洗,將文字的順序分散而將文本化委託給第三者,因此其內容不為第三者所知曉、成為可文本化秘密文件。
並且,以通信方式將文本化亞洲文件傳達給對方時,可將文字圖像經混洗後發送,因此,通信旁路有他人接收時,也有可以保持文件的秘密性的優點。
當然,本發明還可有其他多種實施例,在不背離本發明精神及其實質的情況下,熟悉本領域的技術人員可根據本發明作出各種相應的改變和變形,但這些相應的改變和變形都應屬於本發明權利要求的保護範圍。
權利要求
1.一種亞洲文字圖像的混洗方法,混洗經掃描的亞洲文件的文字圖像,以無規則地改排而製作新的亞洲文件,其特徵在於,該方法包含有如下步驟a)掃描亞洲文件而接收其圖像的步驟;b)將該接收的亞洲文件圖像,分割為文字圖像部分與非文字圖像部分的步驟;c)對該文字圖像部分,構築多解析度位級的樹結構的步驟;d)由解析該多解析度位級的樹結構,抽出可混洗的文字圖像的島的步驟;e)混洗以無規則地選擇含一個或一個以上文字圖像字塊的可混洗的島,使重混洗經該混洗的島返回原來位置的步驟;及f)合併經該重混洗的文字圖像部分與所述非文字圖像部分,作為完全的原來亞洲文件的步驟。
2.一種亞洲文字圖像的混洗方法,是利用權利要求1所述方法對亞洲文字圖像構築多解析度位級的樹結構的方法,其特徵在於,更具有以下步驟i)通過稀疏解析度使文字圖像形成全點圖像,從而構築文字圖像的多解析度塔式結構的步驟;ii)從各解析度位級的塔式結構中,找出所有島的步驟;iii)在塔式結構的各位級間構築所述樹結構各節點的主和次關係的步驟;及iv)使各個位置信息與尺寸信息,持於樹結構各位級的節點的步驟。
3.一種亞洲文字圖像的混洗方法,為權利要求2所述的亞洲文字圖像的混洗方法,其特徵在於,2(j-1)×2(j-1)解析度位級是在圍繞1點的周圍而塗滿,在2j×2j的解析度位級構成1點,所述島被定義為由塗滿4連結所結合的圖像字塊的外框,2j×2j位級與2(j-1)×2(j-1)位級構成節點上的主和次關係,在2j×2j位級的主節點的島,包含所有在2(j-1)×2(j-1)位級的島或次節點。
4.一種亞洲文字圖像的混洗方法,為權利要求1所述的亞洲文字圖像的混洗方法,其特徵在於,所述島的混洗方法更具有以下步驟a)為了配置做混洗的文字島製作空空間的步驟;b)將做混洗的文字島以無規則地選擇每一個,轉移其在該空空間,用該文字島填充所有空空間的步驟;及c)在經混洗的文字島,將做混洗前所掃描的文字島位置坐標作為屬性持有的步驟。
5.根據權利要求1所述的亞洲文字圖像的混洗方法,其特徵在於,為了使經混洗的文字島返回原來位置實行重混洗,使用經混洗的文字島具有作為屬性的原文字島的位置坐標。
6.一種亞洲文字圖像的混洗方法,是根據權利要求1所述方法中將經掃描的亞洲文件分為文字圖像部分與非文字圖像部分的步驟,其特徵在於,該步驟更具有以下步驟a)使用從經掃描的文件分離亞洲文字圖像部分的成像前處理技術步驟;b)對文本文字圖像或前景圖像,使用僅含文字圖像的成像步驟;及c)使用背景圖像的僅含非文字圖像的成像步驟。
7.根據權利要求6所述的亞洲文字圖像的混洗方法,其特徵在於,該成像前處理技術,為實行傾斜校正、除去噪聲、網格線檢測、非文字圖像檢測。
8.一種亞洲文字圖像的混洗處理系統,用於混洗經掃描的亞洲文件的文字圖像,經無規則地改排以製作新的亞洲文件,其特徵在於,所述系統包含如次的裝置一用於掃描亞洲文件而接收其圖像的圖像輸入裝置;一用於將所輸入的亞洲文字圖像,分割為文字圖像部分與非文字圖像部分的裝置;一用於對該文字圖像部分,構築多解析度位級的樹結構的裝置;一用於由解析該多解析度位級的樹結構,抽出可能混洗的文字圖像的島的裝置;一用於以無規則地選擇含一個或一個以上文字圖像可混洗的島進行混洗,重混洗該經混洗的島而返回原來位置的裝置;及一用於合併該經重混洗的文字圖像部分與所述非文字圖像部分,作為完全的原亞洲文件的裝置。
9.一種亞洲文字圖像的混洗處理系統,是權利要求8所述的亞洲文字圖像的混洗處理系統,其特徵在於,對構築亞洲文字圖像的多解析度位級的樹結構的裝置更具有以下的裝置一用於通過稀疏解析度使文字圖像形成全點圖像,從而構築文字圖像的多解析度塔式結構的裝置;一用於從各解析度位級的塔式結構中,找出所有島的裝置;一用於在塔式結構的各位級間,構築樹結構各節點的主和次關係的裝置;及一用於使樹結構各位的節點,持有各個位置信息與尺寸信息的裝置。
10.一種亞洲文字圖像的混洗處理系統,為權利要求9所述的亞洲文字圖像的混洗處理系統,其特徵在於,在2(j-1)×2(j-1)解析度位級塗滿圍繞1點的周圍,構成在2j×2j解析度位級的1點,所述島被定義為由塗滿4連結所結合的圖像字塊外框,2j×2j位級與2(j-1)×2(j-1)位級構成節點上的主和次關係,在2j×2j位級的主節點的島,包含所有在2(j-1)×2(j-1)位級的島或次節點。
11.一種亞洲文字圖像的混洗處理系統,其特徵在於,所述島的混洗裝置更具有以下裝置一用於給欲混洗的文字島形成空空間的裝置;一用於以無規則地選擇每一個做混洗的文字島,將其轉移到該空空間,用該文字島填充所有的空空間的裝置;及一用於使經混洗的文字島,持有將做混洗前所掃描文字島的位置坐標作為其屬性的裝置。
12.根據權利要求8所述的亞洲文字圖像的混洗處理系統,其特徵在於,為了使經混洗的文字島返回原來位置而實行重混洗,使用經混洗的文字島作為屬性所具有原文字島的位置坐標。
13.一種亞洲文字圖像的混洗處理系統,為權利要求8所述的亞洲文字圖像的混洗處理系統,具有將經掃描的亞洲文件分為文字圖像部分與非文字圖像部分的裝置,其特徵在於,所述裝置更具有以下裝置一用於從經掃描的文件中分離亞洲文字圖像的成像前處理裝置;一用於對文本文字圖像或前景圖像,使用僅含文字圖像的裝置;及一用於使用背景圖像僅含非文字圖像的成像裝置。
14.根據權利要求13所述的亞洲文字圖像的混洗處理系統,其特徵在於,該成像前處理裝置為傾斜校正、除去噪聲、網格線檢測或非文字圖像檢測裝置。
15.一種可計算機讀取的記錄媒體,記錄有為了控制計算機的程序,其特徵在於,所述程序是該計算機將經掃描的亞洲文件的文字圖像進行混洗及重混洗,依下述步驟所實行的程序a)掃描亞洲文件,將獲得的圖像分為文字圖像部分與非文字圖像部分的步驟;b)對所述文字圖像,構築多解析度位級的樹結構的步驟,該步驟還包括以下步驟i)解析度位級20×20、21×21、22×22、、、與至全點為止變化文字多解析度的解析度,構築文字圖像的解析度塔式結構的步驟;ii)在各解析度位級的圖像之中,判斷連結有點的為一個島,並檢測所有島的步驟;iii)在成塔式結構的各解析度位級間,構築島的樹結構節點的主和次關係的步驟;iv)將各個前一個位級的島位置信息及尺寸信息作為屬性儲存的步驟;c)混洗亞洲文字圖像,又進行重混洗的步驟。
全文摘要
一種亞洲文字圖像的混洗方法及裝置,用於混洗經掃描的亞洲文件的文字圖像,以無規則地改排而製作新的亞洲文件,該方法包含掃描亞洲文件而接收其圖像的步驟;將接收的亞洲文件圖像,分割為文字圖像部分與非文字圖像部分的步驟;對該文字圖像部分,構築多解析度位級的樹結構的步驟;由解析該多解析度位級的樹結構,抽出可混洗的文字圖像的島的步驟;混洗以無規則地選擇含一個或一個以上文字圖像字塊的可混洗的島,使重混洗經該混洗的島返回原來位置的步驟;及合併經該重混洗的文字圖像部分與非文字圖像部分,作為完全的原來亞洲文件的步驟。通過對經掃描的亞洲文字圖像構築多解析度的塔式構造,採用樹狀數據結構,將標識文字抽出後將其進行混洗。
文檔編號G09C5/00GK1588496SQ20041005733
公開日2005年3月2日 申請日期2004年8月27日 優先權日2004年8月27日
發明者鄭國揚 申請人:威鋒數位開發股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀