文字數據、詞符-插圖數據的輸入輸出裝置及其方法
2023-04-30 05:36:06 1
專利名稱:文字數據、詞符-插圖數據的輸入輸出裝置及其方法
技術領域:
本發明是通過圖象讀取裝置以二值數據得到文字字體(鉛印體或毛筆體等)、詞符-插圖等(為簡單起見,以下簡稱為詞符-插圖)數據後,在不丟失文字、詞符-插圖的特徵的情況下,去除噪聲,進行壓縮、存儲,並根據壓縮過的數據重現文字、詞符-插圖的技術。特別是利用根據母字把文字字體或根據原圖把詞符-插圖自動地變為數字數據,以及以任意的尺寸在任意的位置進行再生,能夠簡單地在印刷機器、文字處理器、微機中使用的技術。
文字字體是規定形狀文字的集合,要想將其自由地縮小或放大後加以利用,就需要以抽象的數據而不是文字的二維形狀進行存儲。由於包括漢字在內的文字的數量很多,所以,如果每一個文字的數據量很大的話,不但輸入數據費時間,還要求存儲裝置的容量要很大。還有,輸出數據也費時間,故而很不經濟。最好是每一個文字的數據量儘可能少。
以往,把每個文字的數據存儲到存儲裝置中的方法有兩種①.把文字數據作為二值數據串進行編碼,這種方法,是把文字作為黑白二值圖象,通過微分等方法抽取出輪廓線,求出輪廓線的連續方向後,編成鏈式字符,存儲始點和字符串。
②.抽取出文字字體的輪廓線,用直線或圓弧進行近似,存儲始點的坐標和直線、圓弧等的函數。由於這種方法能夠壓縮數據,因而輸入、輸出很便利。
本發明屬於後一種方法。抽取出文字字體的輪廓線後,編成鏈式字符時,由於根據圖象最小單位,即象素,存儲輪廓點的坐標,所以,放大時,再生文字的質量低劣。因為是將存儲的數據乘上一定的乘數後來決定放大文字的坐標的,故輪廓點不光滑,成為鋸齒狀。因此,用鏈式字符法不能再生任意倍率的良好的放大文字。
輪廓線可以視為直線與圓弧等的組合,但是,有時也有一部分是其它形狀。這些能用某些函數進行表示。考慮到數據處理的簡易性,數據量越少越好。為了正確地表現文字字體,必須求出能夠正確地近似輪廓線的數據。因此,希望有既能儘量減少數據量又有儘量正確地近似輪廓線的方法。
文字字體是二維信息。關於這方面的先有技術比較少。作為關於一維信息的數據壓縮方法,有特願昭63-211948號專利。這是用二次曲線近似一條連續的曲線,根據近似式求出各點的曲率後,求微分不連續點。微分不連續點相當於連接點。接著,用二次函數近似相鄰微分不連續點間的數據後,進行壓縮。這個二次函數可以由簡單的參數指定。於是,通過指定微分不連續點和二次函數串的參數,能夠近似一維數據。
詞符-插圖是任意形狀和尺寸的圖形、花紋或它們的集合。雖然也有3維的情況,但這裡以2維情況為對象。和文字不同,形狀不是預先確定的,而是根據設計人員的創意創造出來。有多種多樣的詞符-插圖,但在本說明書中,參照
圖17所示的樂譜音符、圖18的半導體二極體、圖44的圓形圖表、圖45的香菸以及圖51-圖57的例子等等進行說明。
原圖是以畫在紙等材料上的狀態直接保存的。原圖只有1份。要想再生只有用複印機進行光學複製。想放大或縮小時,就用複印機進行光學放大或縮小。
還有,想把詞符-插圖插入某種文件中指定的位置時,需要用複印機複印,然後剪切下來,再用漿糊粘到所希望的位置。這全部是手工作業。這樣,由於是不定形的形狀、花紋的集合,所以,難於進行詞符-插圖的記錄、再生、放大、縮小等處理。
因為是設計人員創造出來的,故詞符-插圖的數量極多,而且又由於一個符號反覆使用次數不多,所以,詞符-插圖處理的自動化還沒有達到完全理想的程度。除用複印機複製外也有用印刷機大量複製再生的。然而,這是複印原畫後制的版,所以和光學複製相同。
因此,能夠稱為關於詞符-插圖自動處理的先有技術還不存在。
以往,不存在能夠以較少的數據存儲文字字體並能再生任意大小文字的技術。前述方法是自變量為時間,因變量是位移時使用的方法,所以,數據是一維的信息,例如,處理像聲音這樣的一個變量的情況。
前述方法不能用於文字字體這樣的二維信息的數據壓縮。以橫軸為x,縱軸為y時,可以把y作為x的函數表示文字字體,所以看起來似乎可以把這個方法擴展到2維使用。然而,事實並不如此。由於文字字體的輪廓線是閉合的二維信息,因此,若取獨立變量為x,y就成為x的多值函數,所以不能簡單使用前述方法。
還有,前述方法的對象不是二維信息,所以不具有輪廓線和連接點這樣明確的意義。變量的變化是隨機的,微分不連續點的意義也不明確,所以,沒有考慮這些點的決定是否存在誤差。
然而,對於文字的情況,不僅包含有大量的直線成分,還有很多圓弧部分。當然,變量不會是隨機變化的。
另外,為了把前述方法應用於二維信息,可以考慮某一獨立變量,把輪廓線的x、y坐標視為是相對於該獨立變量的因變量。但,這時不明確什麼量表示曲率。處理二維信息時首先出現的是連接點,但是並不是僅作為微分不連續點而求出的,必須考慮噪聲的影響。有時,表觀上噪聲也以連接點的形式出現。因此,必須去除這些噪聲,求出正確的連接點。
本發明第一個目的是提供一種文字字體數據輸入輸出裝置。該裝置能讀取文字字體、自動地進行數據壓縮和存儲,並能以任意尺寸的文字、在任意的位置再生文字字體。其目標如下(1).節省造字的勞力;
(2).能進行高品質的文字處理;
(3).減少字體的數據量。
以往,尚不存在不用複印機而能再生詞符-插圖的技術。除了直接保存原圖之外,不存在其它的記錄方法。況且,縮小、放大等處理只有依賴複印機。這樣的方法根本不能自動地處理詞符-插圖。用人工方法進行處理不僅費時,而且需要熟練的操作技術。另外,反覆複製後就會摻入噪聲降低畫面質量,放大後輪廓線就變得模糊不清,不能得到漂亮的放大圖。
於是,人們迫切期望能有一種不是保存原圖進行光學處理,而能以數字數據記錄詞符-插圖,並能以任意的尺寸、在任意的位置漂亮地再生詞符-插圖的方法。
為滿足這一要求,本發明的第2個目的是要提供一種詞符-插圖的輸入輸出裝置。該裝置能用光學方法讀取詞符-插圖、自動地進行數據壓縮和存儲,並能以任意的尺寸在任意的位置再生忠實於原圖的詞符-插圖。其目標如下(1).節省造詞符-插圖的勞力;
(2).能進行高品質的詞符-插圖處理;
(3).減少存儲詞符-插圖的數據量。
本發明的文字數據、詞符-插圖數據輸入輸出裝置的特徵在於包含文字、詞符-插圖讀取裝置,用於以光學方式讀取文字字體數據、詞符-插圖數據,並對應於縱橫方向上有限個排列的象素存儲這些數據;
輪廓線抽取機構,用於對應縱橫排列的象素抽出己讀取的文字的輪廓線;
輪廓點串存儲機構,用於對每個使抽出的輪廓線的二維坐標(x,y)連續的群進行存儲;
數據近似機構,用於把自變量記為t,把因變量記為x,y,用以t為自變量、以x和y為因變量的2次分段多項式近似上述每個群的輪廓點串的x,y坐標,反覆進行最小二乘法近似,直到近似精度達到指定的範圍,從而求出每個輪廓線點中的每個群的近似多項式;
曲率運算機構,用於從上述近似結果求x,y空間的每個群的點串中各點的曲率;
正圓抽取機構,用於從每個群的曲率數據中抽取出正圓;
臨時連接點位置抽取機構,用於從點串的曲率數據中把空間不可微點作為臨時連接點抽取出來;
最佳連接點抽取機構,用於把位於臨時連接點近旁的其它候補連接點根據相關關係進行概率擬合,求出最佳連接點;
不必要的連接點去除機構,用於從最佳連接點中找出既使去掉也可以保證近似精度的那些不必要的連接點;
數據近似機構,用於當按直線、圓弧的次序近似同一點串群內相鄰連接點的間隔而不能得到指定的近似精度時,用以t為自變量、以x、y為因變量的2次分段多項式近似,並增加2次分段多項式的因次數,同時反覆進行最小二乘法近似,直到近似精度達到指定的數值後,在相鄰連接點間用直線、圓弧、2次多項式進行近似;
壓縮數據存儲機構,用於存儲點串的每個群中近似上述連接點的坐標和相鄰連接點的函數的參量;
壓縮數據輸出機構,用於輸出存儲的用來近似點串的每個群中的連接點的坐標和相鄰連接點的函數的參量;
壓縮數據輸入機構,用於輸入壓縮數據;
輪廓線再生機構,用於根據輸入的壓縮數據得到近似點串的每個群的連接點的坐標和相鄰連接點函數的參量,從而再生輪廓線;
文字、詞符-插圖再生機構,用於使與再生的輪廓線的內部象素與外部象素不同的值對應;
再生數據輸出機構,用於把再生的文字字體和詞符-插圖作為文字、詞符-插圖輸出。
圖1是表示本發明的文字字體、詞符-插圖數據輸入輸出裝置的總體結構圖。
圖2是在讀取了文字、詞符-插圖的圖象上對於象素定義的x、y坐標系的示意圖。
圖3是一個象素周圍的鏈形碼示意圖。
圖4是在圖象數據中用於搜索輪廓點的掃描方向示意圖。
圖5是在已知一個輪廓點時用於尋找下一個輪廓點的搜索方向示意圖。
圖6是存在黑象素和白象素時某輪廓點和下一個輪廓點的示意圖。
圖7是在「口」字型的圖象數據中抽出外側輪廓線和內側輪廓線,並使2值數據與象素對應的狀態示意圖。
圖8是表示輪廓點串抽取裝置結構的流程圖。
圖9是為近似輪廓點串求曲率的數據近似機構的流程圖。
圖10是數據近似機構的一部分,表示在用分段多項式近似全部輪廓點串時決定係數的過程的流程圖。
圖11是用於計算前段所述近似的輪廓點串的各點處的曲率的流程圖。
圖12是表示根據用分段多項式所近似的數據抽取正圓的機構的流程圖。
圖13是表示連接點抽取方法的概略的流程圖。
圖14是表示根據前面計算的曲率抽取連接點的位置的機構的流程圖。
圖15是用於製作文字字體的原文字「あ」、「ボ」的示例圖。
圖16是求「あ」和「ボ」的輪廓點串並進而抽出連接點的示例圖。
圖17是作為詞符-插圖的一例的樂譜的16分音符圖。包括原圖(a)和表示其輪廓點串抽取結果和連接點抽取結果的圖(b)。「x」號表示連接點。
圖18是作為詞符-插圖的一例的半導體二極體圖。包括原圖(a)和表示其輪廓點串抽取結果和連接點抽取結果的圖(b)。
圖19是最佳連接點抽取機構概略的流程圖。
圖20是根據曲率所選擇的臨時連接點及其近旁的候補連接點編號的示意圖。
圖21是在根據曲率所選擇的臨時連接點附近有近旁連接點時輸出近旁的各點的編號示意圖。
圖22是在有近旁連接點時決定相宜係數的流程圖。
圖23是連接根據曲率所選擇的臨時連接點附近的候補連接點C、輸出近旁的候補連接點B、臨時連接點的下一個連接點D與輸出近旁的連接點的前一個連接點A的近似曲線和拐點的數目的示意圖。
圖24是在根據曲率所選擇的臨時連接點附近不存在近旁連接點時求相宜係數的流程圖。
圖25是在臨時連接點附近不存在近旁連接點時,該臨時連接點的候補連接點B、前後臨時連接點的候補連接點A、C和連接它們的曲線、以及表明這些點的編號的示意圖。
圖26是說明根據曲率所選擇的臨時連接點附近的候補連接點C、輸入近旁的近旁連接點附近的候補連接點B和該臨時連接點前面一個臨時連接點的候補連接點D的定義和符號的說明圖。
圖27是用於決定一個臨時連接點的輸入近旁及輸出近旁的近旁連接點的流程圖。
圖28是表示候補連接點內哪個為最佳連接點的概率變量的定義和反覆運算的流程圖。
圖29是其它最佳係數的給出方法的流程圖。
圖30是對以臨時連接點為中心的2a+1個候補連接點給出的初始概率的示意圖。
圖31是對全部臨時連接點進行概率變量的計算並把給出最大概率的候補連接點作為最佳連接點存儲到最佳連接點存儲裝置的示意圖。
圖32是以「ぱ」為例,簡單地回顧迄今為止的操作程序的示意圖。
圖33是以變形二極體的圖為例簡單地回顧迄今為止的操作程序的示意圖。
圖34是說明從最佳連接點串去除不必要的連接點求出最終連接點的操作流程圖。
圖35是在多個直線連接點連續存在時,應判斷是否應去除的對象的中間連接點和兩端連接點的符號的示意圖。
圖36是在圖35的配置下從中間的連接點向連接兩端的連接點的直線所做的垂線的垂足長度小於某個閾值時去除中間的連接點的示意圖。
圖37是在多個圓弧連接點連續存在時應判斷是否應去除的中間連接點和兩端連接點的符號的示意圖。
圖38是在圖37中從第1個連接點開始的圓弧的半徑、中心,以及從第2個連接點開始的圓弧的半徑、中心的示意圖。
圖39是根據輪廓點串、最終連接點、正圓等的數據來近似數據,並利用近似函數表示輪廓點串的操作說明圖。
圖40是「體」字的原圖象和利用本發明的方法將其進行數據壓縮後再生的圖象。
圖41是「語」字的原圖象和處用本發明的方法將其進行數據壓縮後再生的圖象。
圖42是「明」字的原圖象和利用本發明的方法將其進行數據壓縮後再生的圖象。
圖43是樂譜的16分音符的詞符-插圖的原圖象(a)和利用本發明的方法進行數據壓縮後再生的圖象(b)。
圖44是圓形圖表的詞符-插圖的原圖象(a)和利用本發明的方法進行數據壓縮後再生的圖象(b)。
圖45是香菸的詞符-插圖的原圖象(a)和利用本發明的方法進行數據壓縮後再生的圖象(b)。
圖46是2次光滑函數和0次、1次、3次光滑函數(fluency)的概略圖。
圖47是採用2次光滑函數、而基函數的數目較少時,即使不能充分地近似數據,只要提高因次數,就能提高近似程度的事例的概略圖。
圖48是以「和」字為例,用分段多項式近似全部輪廓點串的過程的示意圖。
圖49是以香菸的詞符-插圖為例,用分段多項式近似全部輪廓點串的過程的示意圖。
圖50是半導體二極體的詞符-插圖的原畫象(a)和利用本發明的方法進行數據壓縮後再生的圖象(b)。
圖51是含有文字且自由曲線較多的詞符-插圖的例子。
圖52是圖51的詞符-插圖的縮小圖。
圖53是自由曲線較多的詞符-插圖的例子。
圖54是根據本發明的方法把圖53存儲、變形後輸出的示例圖。
圖55是包含裝飾文字和圖形的詞符-插圖的例子,(a)是縮小圖,(b)是放大圖。用本發明的裝置存儲其中的任一個就能夠簡單地得到另一個圖形。
圖56是利用本發明的方法把蝸牛的詞符-插圖印到明信片的某位置上的示例圖。可以任意決定、變更尺寸和位置。
圖57是利用本發明的方法把山嶽的詞符-插圖印到明信片的某位置上的示例圖。可以任意決定、變更尺寸和位置。
圖1中把總體結構示為一覽表的形式,在這裡,預先寫出所有的機構A.圖象存儲裝置1B.輪廓點串抽取裝置C.輪廓點串存儲裝置D.數據近似機構AE.曲率運算機構E′.近似曲率存儲裝置F.正圓抽取機構G.正圓存儲裝置H.連接點位置抽取機構I.連接點位置存儲裝置J.最佳連接點抽取機構K.最佳連接點存儲裝置L.連接點去除機構M.最終連接點存儲裝置
N.數據近似機構BO.壓縮數據輸出機構P.壓縮數據存儲裝置R.輪廓再生機構S.文字、詞符-插圖再生機構T.再生數據輸出機構U.圖象存儲裝置2。
作為例子,對圖32所示的「ぱ」字簡單地說明操作順序。圖32後面還要再一次說明。首先用圖象掃描器讀取寫在紙上的「」,這是文字的光學讀取、輸入。當抽出輪廓線的集合即輪廓點串時,就成為黑框白底字。在本例中有5個輪廓點串群。左邊的縱線有1個,中央與「ょ」相似的部分有2個,右邊肩部的圓圈有內外2個。使用參變量表示方法,把X,Y坐標作為t的函數。在每一個輪廓點串群中,用分段多項式進行全部近似。在分段的多項式中成為連續函數,所以在各輪廓點串中可以進行2階微分求曲率。曲率一定的輪廓點串是正圓,這樣就作為正圓被分離出來。在本例中,右上肩的「O」就被去除了。在本例中剩下的還有3個輪廓點串群。曲率大的位置是連接點。在第4步,對輪廓點串的交點和彎曲點等處標上「x」號。這是連接點。也有後來追加輪廓點串的情況。
根據連接點分割出輪廓點串,若曲率很大,也可以使用所求出的最初的連接點(稱為臨時連接點)作為連接點。對於文字字體的情況,因為從開始就是以漂亮地書寫的文字為對象的,所以噪聲難以混入,故即使只根據曲率也能夠正確地求出連接點。這樣,計算就極其單純化了。
有時,要對連接點進一步反覆推敲。這時,便考慮與鄰近連接點的配合來修正連接點。這些作為臨時連接點的候補連接點將在後面進行說明。另外,修正連接點的位置後,對去除不必要的連接點也是有效的。也有再追加新連接點的情況。這樣,就能有效地去除在進行光學讀取等操作時所產生的噪聲。
當確定了連接點時,就可以用直線、圓弧、自由曲線近似連接點之間的連線。近似按直線、圓弧、自由曲線的順序進行。由於是文字字體,所以直線部分較多。特別是對於漢字的情況,直線部分的比率極高,僅次於直線的是圓弧,對於漢字的情況,可以認為比率高低的順序是直線、圓弧、自由曲線。不過,近似的順序為直線、圓弧、自由曲線的理由並不是因為其出現頻度為這個順序。
不是由於頻度,而是為了提高所記錄的數據的品質來按這個順序近似的。如果從開始就以自由曲線進行近似,則直線和圓弧也就相應地被用2次曲線進行近似。2次曲線的集合不能正確地表現直線和圓弧。存在噪聲時,近似出的直線、圓弧更加變形。由於確實存在直線和圓弧部分,故為確實地抽出它們而按直線、圓弧、自由曲線的順序進行近似。對於直線,進行近似所需要的時間短,數據量也少。圓弧的近似也比較簡單,只要給出圓心的坐標、半徑、圓心角就可以了。
既不能用直線,也不能用圓弧進行近似時,就用自由曲線進行近似。這時,把連接點之間分割為n個小區間用分段多項式進行近似。由於增加小區間分割數能夠提高近似程度所以近似達到所希望的精度。
這樣,由於可以得到連接點和直線、圓弧、自由曲線的參量,所以可以把這些參量作為文字字體的數據進行存儲。隨各文字的筆劃數和複雜程度不同,1個文字大約用300-500位元組的數據就夠了。如果是黑白圖象的原圖,則需要構成畫面的全部象素數的數據。例如,假設有縱橫256個象素,則也有8k個字節,而按照本發明就能大幅度地壓縮數據。反過來,讀出這些數據後,又可以連接點為基準再生出直線、圓弧、自由曲線。並且通過計算,能夠以任意的尺寸、在任意的位置再生。
作為詞符-插圖的例子,簡單地說明圖33所示的半導體二極體的詞符-插圖的操作順序。圖33還要在後面再次說明。這是為說明正圓的抽取,在右上肩畫入了一個多餘的圓。
首先,用圖象掃描器讀取畫在紙上的半導體二極體的圖形,這是詞符-插圖的光學讀取和輸入。當抽取出輪廓線的集合即輪廓點串時,就成為黑框白底的詞符-插圖。在本例中,作為輪廓點串的群有5個。右上肩的圓有內外2條輪廓線,二極體部分有外側輪廓線和內外上、下輪廓線,合計是5條。
用參變量表示,把x,y坐標作為t的函數。在各個輪廓點串群中,全部用分段多項式進行近似。由於在分段多項式中為連續函數,所以在各輪廓點串中可以做2階微分求曲率。曲率一定的輪廓點串是正圓,這樣就作為正圓被分離出來。在本例中,右上肩的「O」就被去除。
在本例中,餘下的還有3個輪廓點串群,曲率大的位置是連接點。在第4步,對輪廓點串的交點、拐點等處標上「x」號,這就是連接點。也有在後來追加輪廓點串的情況。
利用連接點分割出輪廓點串。若曲率很大,也可以使用所求出的最初的連接點(稱為臨時連接點)。對於詞符-插圖的情況,若從開始就使用漂亮地描畫的詞符-插圖,由於噪聲難以混入,故即使只根據曲率也能夠正確地求出連接點。這樣,計算就極其單純化了。但是,按照本發明,即使根據包含噪聲的原圖也能夠得到非常漂亮的複製圖形。
以後的順序與文字字體的情況相同。
實施例A.圖象存儲裝置1這是用光學方法讀取寫在紙等介質上的文字字體,詞符-插圖,並以分解為各象素的信息進行存儲的裝置。文字、詞符-插圖即使著色也可以,但是,所需要的是黑白2值圖象。例如,將著色部分作為黑色,將不構成文字、詞符-插圖的部分作為白色形成2值圖象,把它們按各個象素進行存儲。
例如,用圖象掃描器以256×256個點的精度輸入。當然,點的數目是任意的,點數越多,作為文字,詞符-插圖所存儲的內容的品質就越高,但是點數太多時,計算時間和存儲容量就增大,所以,使用適當點數的圖象讀取裝置就行了。對每個點(象素)區別出是白象素或黑象素後暫時存儲起來。以後,有時把一個象素稱為點。另外,把一系列連續的黑象素串稱為點串。為了表示點,使用由畫面上象素的橫向符號x和縱向符號y約成的坐標(x,y)進行表示。對坐標變量標以各種下標以示區別。
B.輪廓點串抽取裝置輪廓點串抽取裝置是進行求所讀取的文字、詞符-插圖的輪廓線的操作的裝置。下面先介紹其大致的流程。
①.從左上方到右下方掃描圖象數據,並尋找還未被找到的輪廓點(示於圖4)。
②.環繞輪廓線一周搜索下一個輪廓點。輪廓點用2標記。
③.檢查圖象數據直至右下方的數據為止。
首先根據定義說明進行的這一操作。圖象用象素的集合進行表示。象素用畫面內的坐標進行指示。象素的坐標以行(橫)方向的坐標為x,以列(縱)方向的坐標為y。左上方的坐標為x=0,y=0。若橫向有x個象素,縱向有y個的象素,則x的取值為0~X-1,y的取值為0~Y-1。坐標系如圖2所示,是指向右下方的。圖象本身是輸入的文字、詞符-插圖,所以只取黑、白2個值。對每個象素進行黑白的指定。
二值圖象輸入按如下方式定義特性函數gxy(ⅰ)在0≤x≤X,0≤y<Y內,坐標(x,y)上存在點(黑象素)時,gxy=1(1)(ⅱ)其它情況(在該點上不存在黑象素)gxy=0(2)輪廓點串的表現所謂輪廓點串是存在於黑象素群周圍的黑象素的左右上下傾斜的連續點的串。不僅在外部,在內部也有輪廓點串。把閉合的一個點串稱為輪廓點串。設輪廓點串的總數為U。對U個輪廓點串標以從0到U-1的序號。第u個輪廓點串的輪廓點的總數用N(u)表示。在一個輪廓點串中,對連續的點標以序號k。k是0~N(u)-1的整數。
把第u個輪廓點串的第k個輪廓點的坐標用(xuk,yuk)表示。全部輪廓點用{(xuk,yuk)}k=0Nu-1u=0U-1(3)
表示。k=Nu-10表示點串序號k能取從0到N(u)-1的值。Nu-1含有括號,而括號在打字時不能用1/4角的格式,所以作為變量的標註時,去掉括號寫為N(u)-1。即Nu-1=N(u)-1。由於是標註,故應該按上下方式寫,但這在打字時不可能,所以分為左下和右上進行標準。u=ou-1表示輪廓點串群的序號u取0~U-1的值。另外,輪廓點串的序號u應在變量的右肩加上括號,但因為括號在打字時不能用1/4角的格式故省略。實際上如圖所示的那樣是帶有括號的。不是變量的u次方。這對於參變量t、自變量x、y等都是相同的。u是群序號,直接寫在變量的右肩上,但實際上是帶有括號的。鏈形碼如圖3所示,以某象素為中心,周圍8個點的象素按順時針標以序號0-7。這是為了表示輪廓點中點串的連續而使用的。另外,也用於調查連續的狀態。設C為鏈形碼,定義如下的函數α(c)和β(c)。函數α(c)為c=3,4,5時,α(c)=-1(4)c=2,6時,α(c)=0(5)c=0,1,7時,α(c)=1(6)函數β(c)為c=5,6,7時,β(c)=-1(7)c=0,4時,β(c)=0(8)
c=1,2,3時,β(c)=1(9)根據這樣的定義進行輪廓線的抽取。如前述,像圖4所示那樣把整個圖像從左上方到右下方進行掃描尋找出黑象素。輪廓線是二值圖象的gxy=1部分的外周的象素,在循環1周進行搜索的同時,就把點串的坐標存儲起來。環繞1周的方向規定為在其區域的外側環繞時,按順時針方向旋轉,在其內側環繞時按逆時針方向旋轉。圖5示出了環繞輪廓點的順序。當然也可以規定按與上述方向相反的方向環繞,但這裡討論的是按上述規定環繞的。
假定已知道了某輪廓點串中的某輪廓點。為了求出下一個輪廓點,就以此輪廓點為中心,從前一次的輪廓點開始按順時針方向旋轉搜索8個相鄰象素。圖6示出其一例。設標以「☆」符號的是最新的輪廓點。按順時針方向旋轉搜索下個輪廓點,但直到序號1,2,3,4,5全是白象素gxy=0,所以不符合條件。第6個象素是黑象素,因gxy=1,所以是輪廓點。這樣,由於求出了下一個輪廓點,所以就以第6個象素為中心來求其下一個輪廓點。
下面,用同樣的順序可以求出一個個輪廓點。因是根據鄰近8個象素求下一個輪廓點的,所以能夠得到連續的輪廓點串。輪廓點把gxy的值取為2。由此能夠與內部的黑象素gxy=1相區別。另外,由於gxy=1的象素應該局限在畫面上,所以如果逐次求輪廓點,就會回到最初的輪廓點。即輪廓點串形成環狀。設這樣的輪廓點串總共有U個,輪廓點串的序號用u表示,某輪廓點串u部的點的序號用k表示。
確定了1個輪廓點串時,就重新開始圖4的掃描,搜索下一個輪廓點。知道了這個輪廓點後,就按同樣的順序確定輪廓點的坐標。有多個輪廓點串時,當然是從左上方開始進行這些處理並順序標以0、1,…(U-1)的輪廓點串序號。對於內部有孔的情況如圖5所示,可以通過若干次的掃描檢出某些點。雖然進行圖6所示的相鄰點的搜索,但是,有孔時就如圖5所示的那樣按逆時針方向旋轉找出輪廓點。這樣,不論是外部的輪廓點串還是內部的輪廓點串,探索到後就存儲點串的坐標。這些點串的gxy的值成為2。
由於輪廓點串的搜索是對於gxy=1的象素進行的,所以在外周和內周的寬度僅為1個象素時要產生一點問題。如圖7所示。(a)是僅為1個象素寬度的環狀的圖形。gxy=1的象素分布為正方形。若寬度大於2個象素,就可以按前述的順序毫無問題地求出外部輪廓點串、和內部輪廓點串。但是,如果寬度是1個象素,由於在先確定了外周的輪廓點串後,gxy=1的象素是輪廓點,故變為gxy=2。因為輪廓點的搜索是對於gxy=1進行的,因此gxy=2就不能再成為輪廓點串。於是,不去識別內周的輪廓點串。因此,就不考慮孔的存在。由於這樣是不行的,所以,作為對策,規定當下一個輪廓點位於現輪廓點的下方時就不進行賦值(gxy→2),該點仍保留為gxy=1。在圖7(b)中,右邊中間的值為1就表示這一點。因為數值為1,所以,就找到了作為內輪廓點的出發點。從該點出發能夠抽出內輪廓點串。結果,可以既不忽略內部的孔又能找出內外輪廓點串。圖7(c)示出了這一結果。
結果確定了輪廓點串,由輪廓點串所包圍的內部的黑象素就不是為了規定這個區域最早所必須的象素了。因此,內部的黑象素就不必存儲。這樣,就可以先減少應存儲的數據量。
C.輪廓點串存儲裝置輪廓點串存儲裝置是存儲在前段所求的輪廓點串的裝置。以(xuk,yuk)k=0Nu-1u=0u-1的形式進行存儲。如前所述,U是總點串數,u是點串的序號。點串u是的點的數目是N(u),k是點的序號。用k=0Nu-1u=0u=1表示上述規定。(xuk,yuk)是第u個點串的第k個點的x、y坐標。再重複說明一下,把N(u)-1以標註的形式寫為Nu-1。
D.數據近似機構A數據近似機構有2個。這是最初的1個,為區別起見標以A。這是假定求出的輪廓點串的曲率大時,為了求連接點所必須的。為了求曲率,也可以在離散的點內採用若干個點作為數據,根據這些數據來求。本發明採用這樣的離散曲率也可以實施。但是,這裡用連續函數近似數據後,將其進行2階微分求曲率。因此,此處的近似是數據近似。
因為是求曲率,所以,通常的方法是把x作為自變量,y作為因變量,求y對x的二階微分。但是這樣一來,對x,y的處理就變成非對稱的,這是所不希望的。本發明不採用這樣的方法。
這裡,設自變量為t,因變量為x,y,用以t為自變量,x和y為因變量的2次分段多項式近似前述每個連續群的輪廓線的點串的x,y坐標,反覆運用最小二乘法近似,直到近似精度達到指定的範圍,求出輪廓線點串的每個群的近似多項式。這樣做不是要得到最終的數據而是求連接點。
如前所述,把群u的點串k的坐標寫為(xuk,yuk)。根據前述輪廓線點串存儲機構可以得到這個坐標。圖9示出了這一操作。先從輪廓點串存儲裝置讀入輪廓點串全部的(xuk,yuk),把它們分解為參變量。即對於各點使共同的參變量t與2個(xuk,yuk)對應,也可以附加標註,成為tuk。雖然是二維信息,但是,為了把它用於一維問題而使用了參變量。圖9的第2步示出了這一過程。
通過使用參變量,(tuk,xuk)和(tuk,yuk)這2個坐標的組合就和各輪廓點串的各點對應。以後,由於對2個變量的處理相同,故僅對1個進行說明。
按照以二維光滑函數(Fluency functions)的函數{ψm}為基底的線性組合給出近似群u中的輪廓點串(tuk、xuk)的t的函數Sx(t)。根據Sx(t)來近似群u中t的函數x。同樣,利用Sy(t)也可以近似群u中的y。近似函數是否合適,可以通過評價最小二乘法的誤差是否在規定的範圍內來確定。
應該注意的是,這裡是利用Sx(t)、Sy(t)近似輪廓點串群u的整個閉合曲線的。是用1個函數Sx(t)近似全體而不是中途具有的連接點。這是因為還沒有決定連接點。如前所述,為了求曲率,有不利用近似的更簡便的方法,那就是直接用輪廓點串的數據求離散曲率的方法。為了實施本發明,也可以利用這樣的離散曲率,但是,這裡對此不作說明,而說明近似函數Sx(t)、Sy(t)的生成。
將Sx(t)以非周期m次光滑函數ψk為基底展開,則Sx(t)=∑k=-mM+mCxkφk(t)(10)所謂光滑函數是本發明者命名的函數名。次數m對應於多項式的因次。M是維數。一般,設m次光滑函數的定義域為〔o,T〕,參量為k,把這個參量作為角標表示。Cxk是線性組合係數。ψk本身是在k附近有值的多項式。
φk(t)=3(T/M)-m∑q=0m+1(-1)q{t-(k+q)(T/M)}m+/{q!(m+1-q)!}(11)式中,k=-m,-m+1,…,0,1,2,…,m+M這裡,標在m次下方的「+」號表示括號內的值為負時是0,括號內的值為正時是m次方的意思,即定義如下(t-a)m+=(t-a)mt>a(12)0t≤a(13)基底函數ψk是在分段序號k~k+m+1內具有有限值、而在其兩側為0的山峰形函數。這是把{t-(k+q)(T/M)}m+從0上升的m次函數沿橫向一個坐標一個坐標地移動(一個q一個q地增加)、重迭組合而成的形狀。t>(k+m+1)(T/M)時,必須恆等於0。根據這一條件,重迭係數由(-1)q/{q!(m+1-q)!}決定。使區域的大小T與輪廓點串群的點數N(u)相等是比較簡單,但也可以按某種比例進行定義。這樣,利用光滑函數就可以近似輪廓點串。但是,由於具有T/M間隔的分割點有很多,故即使沒有連接點也能夠近似。為提高近似程度,可以提高光滑函數的因次m。但是,如果因次數很高,計算次數就要增加,從而會使處理時間加長。
本發明者的主張是表示眾多自然界物理量變化的函數可以用1次、2次光滑函數的線性組合表示。光滑函數並不是完備、正交、規範化函數。如果採用m值取到無窮大的函數並把它們進行線性組合,就可以表現任意的函數,這是毫無疑義的。然而,本發明者所說的並非如此,而是利用很小因次數的光滑函數描述自然界物理量的變化的情況。這裡只採用m=2。這樣就可以使文字、詞符-插圖等的輪廓線不會表現得過分不足。當然,本發明可以用m=3以上的光滑函數構成。
如果採用最適宜的函數系並利用它們的線性組合來描述物理量的變化,則可用最少的函數得到最佳的近似。如果函數系不佳,則必須以較多的函數為基底展開線性組合式。這樣,既不能得到良好的近似,而且最終的數據也增多,從而導致存儲裝置的負擔增大。還有,讀出這些數據進行利用也不容易。故應選擇最佳函數系。本發明者認為m=2為最佳。
本發明者在這裡採用m=2的光滑函數。圖46(a)示出了2次光滑函數的概略。這是跨越3個區間的2次曲線。兩端的上升邊和下降邊是2次函數。中央的點為最大值,其鄰域也是2次函數。
0次光滑函數如圖46(b)所示,是僅在1個區間內取一定值的箱形函數。
1次光滑函數如圖46(c)所示,是跨越2個區間的三角形函數。
3次光滑函數如圖46(e)所示,是涉及4個區間的光滑函數。
一般m次光滑函數是跨越(m+1)個區間、中部具有極大值中部的平滑(m≥2)的函數。兩端有以m次方的上升邊和下降邊。中部的函數形狀仍是m次方。基底ψk的參量k每增加1,就從原來的位置向右平移1個單位。如果用m次分段多項式近似在某區間的某種變化,則在該區間具有值的函數的基底有(m+1)個。雖然可以採用m=3以上的函數,但這裡取m=2。即,在3個區間上有值,極大值和端點處的2次函數。上式中m=2時,則Sx(t)=∑k=-2M+2Cxkφk(t)(14)φk(t)=3(T/M)-2∑q=03(-1)q{t-(k+q)(T/M)}2+/{q!(3-q)!}(15)基底函數是4個從0開始上升的2次函數的重迭組合。這4個函數以{t-(k+q)(T/M)}2+所示的向橫向逐次移動T/M。是小區間的數目從k到k+3有值的函數。由於大於k+4時恆等於0,故重迭係數成為(-1)q/{q!(3-q)!}。基數函數的數目為M+5個。M是全區間的分割數,將其稱為近似的因次數。不能把它與光滑函數的次數m混同,用圖47說明這一點。圖(a)示出數據點。數據的區域是0~T。圖(b)示出基底函數為3個、因次M為1的情況。這時,由於基底函數太少,所以係數的量也少,因而給不出良好的近似。然而,如果增加因次M,就如(C)所示,無論多麼複雜的變化也能近似。近似的程度可以用在多大程度上接近原輪廓點串(xuk,yuk)來判斷。根據最小二乘法評價,就是使Q=∑{Sx(tuk)-xuk}2+{Sy(tuk)-yuk}2(16)為最小。求和的範圍是輪廓點串群u的全部點。這裡,由於僅求曲率,所以精度不必很高。在後面說明的第2次的數據近似B中也是進行同樣的近似。那時,精度將更高。
圖10示出這一部分的流程。這是決定係數Ch,它的階段是M。規了某個M時,根據(10)式,係數Cxh就唯一地決定了。然而,該係數並不限於滿足最小二乘法的限制。這時,使因次M增加1。因而,當達到所希望的近似範圍時,就用這個值確定因次M中的係數Ch。
(10)式左邊的Sx(t)在t=tk時應成為Sx(t)=xuk。而且,把這個值代入到(10)式中,則xuk=∑h=-2M+2Cxhφh(tuk)(17)把上式乘以ψw(tuk),並對點串k求和,則∑k=0N-1φw(tuk)xuk=∑k=0N-1∑h=-2M+2Cxhφh(tuk)φw(tuk)=∑h=-2M+2∑k=0N-1φh(tuk)φw(tuk)Cxh(18)
這裡,從第2式到第3式的變化是交換了求和的順序。由於是有限數列,故可以自由地變更求和次序。
該式的左邊∑k=0N-1φw(tuk)xuk可以認為是標註為W(W=-2,-1,0,1,2)的M+5維的列向量。右項的前項可以認為是光滑函數的乘積之和∑k=0N-1φh(tuk)φw(tuk)即M+5列、M+5行的正方形矩陣。另外,右邊的後項Cxh是M+5列的行向量。由於在文字上方不能添加「→」符號,所以決定以下把表示向量的符號「→」加在文字之後。用向量=cx→=T{C-2x、C-1x、····Cm+2x}(19)向量=bx→=T{∑K=0N-1φ-2(tuk)xuk,∑k=0N-1φ-1(tkxuk···,∑k=0N-1φM+2(tuk)xuk}(20)定義向量bx→、向量Cx→。T表示轉置矩陣。
矩陣G定義為G={Ghw}={∑K=0N-1φh(tuk)φw(tuk)}(21)向量之間下式成產立bx→=Gcx→(22)這是求向量C→的公式,但是,以cx→=G-1bx→(23)的形式可以求關於某個因次數M的係數Ch。G-1是矩陣G的逆矩陣。這是對於x的計算。對於y同樣Sy(t)=∑h=-2M+2Cyhφh(t)(24)
yuk=∑h=-2M+2Cyhφh(tuk)(25)∑k=0N-1φw(tuk)yuk=∑k=0N-1∑h=-2M+2Cyhφh(tuk)φw(tuk)=∑h=-2M+2∑k=0N-1φh(tuk)φw(tuk)Cyh(26)也成立,用向量cy→=t{C-2y、C-1y、····Cm+2y}(26′)向量by→=t{∑k=0N-1φ-2(tuk)xuk,∑k=0N-1φ-1(tukxuk,···,∑k=0N-1φM+2(tuk)xuk}(27)來定義向量b→、C→。和(23)式相同,對於y分量也可以以cy→=G-1by→(28)的形式求關於某因次數M的數Cyh。G-1是矩陣G的逆矩陣,和用於x的計算相同。圖10說明了這一情況。最初是對群序號u=0進行的。另外,近似次數M從1開始。這樣,對於輪廓點串u=0可以求出近似(xuk,yuk)的Sx(t)、Sy(t)的係數Cxh、Cyh。計算它們與(xuk、yuk)點之差的平方和Q,則為Q=∑k=0N-1{Sx(tuk)-xuk}2+{Sy(tuk)-yuk}2(29)把Q值與預先確定的閾值ε相比較。ε是充分小的確定的正定數。在此取為1個象素的距離。如果Q>ε,則近似就不夠充分。因此,這時,就把次數M從1增加到2。於是Ch數增加1。
在此種狀態下,反覆同樣的過程,如果還是Q>ε。就進一步把M加1。然後,反覆同樣的過程,提高近似程度,直至使Q<ε。這樣就確定了M和{Cxh}、{Cyh}。從而可以求近似函數Sx(t)、Sy(t)。當完成對輪廓點串群u=0的計算時,對u=1的群進行計算。以下,同樣,當對某個u值決定了係數時,就對下一個u+1的輪廓點串進行同樣的計算。並且反覆進行計算直至u=U-1群為止。
下面,根據圖48再次說明文字字體的近似機構的過程。設畫面上輸入「和」字。如果進行輪廓點串抽取,能得到3個輪廓點串群。左邊的輪廓點串為u=0,右邊的「口」部分具有外輪廓點串u=1和內輪廓點串u=2。從畫面左上方的點(0,0)開始向右方向逐行掃描象素的值。把最先遇到輪廓線點記為(too,xoo)、(too,yoo),以t為參量求輪廓點串的坐標。作為t的函數能夠得到輪廓點串坐標x(t)、y(t)。若用2次光滑函數進行近似,則首先從M=1出發。這是把全區間〔0,1〕作為1個區間處理。3個基底函數ψ-2、ψ-1、ψ。在這個區間有值。適當地選擇這些函數係數的3個值,能得到中間所示的近似曲線、放大後來看,可知與原數據的誤差相當大。根據誤差的平方和評價誤差,近似不充分時,使M增加1。在下一步,示出了m=2的例子。基底函數增加為4。最後一步示出了M=10的情況。基底函數的個數為12。隨著M的增大,能夠精密地近似複雜的曲線。這裡所說明的是用於求曲率的近似,而在後面所述的數據壓縮時的近似中,對各個區間進行這種操作。
以上是數據近似機構A。
下面根據圖49進一步說明詞符-插圖情況的近似機構的過程。設畫面上輸入香菸的概略圖的圖形。如果抽取輪廓點串,能得到2個輪廓點串群。左邊長方形的輪廓點串為u=1,右邊煙的部分具有輪廓點串u=0。從畫面左上方的點(0,0)開始向右方逐行掃描象素的值。把最初遇到輪廓線的點記為(too,xoo)、(too,yoo),以t為參量求輪廓點串的坐標。能夠得到作為t的函數的輪廓點串坐標x(t)、y(t)。
其後的過程與圖48文字字體的場合相同。
E.曲率演算機構由於對所有的輪廓點串群求出了近似函數,故通過對這些函數求2階微分,可以求出各輪廓點串群和各點的曲率。圖11示出了曲率計算的流程。輪廓點串群u的第k個點(xuk、yuk)的曲率K(tuk)可以利用公式K(tuk)={Sx′(tuk)Sy″(tuk)-Sx″(tuk)Sy′(tuk)}/{Sx′(tuk)2+Sy′(tuk)2}3/2(30)進行計算。從最初u=0的輪廓點串群的k=0的點開始計算。對每個點進行這一計算。即,當完成對第k點的計算時,接著就對第k+1點進行同樣的計算。當一個輪廓點串群的計算結束後,就移到下一個輪廓點串。並且,對所有輪廓點串的全部點求曲率。
E′.近似曲率存儲裝置這是把在前一步所求的曲率K(tuk)按每個點(輪廓點串群u、第k點)進行存儲的裝置。
F.正圓抽出機構這是根據近似曲率判斷某個輪廓點串是否為正圓、並抽出正圓的機構。文字、(詞符-插圖中有不少正圓部分。就是利用字文、詞符-插圖的這種性質。然而,這裡所說的正圓是對輪廓線而言的,所以,指的是孤立的正圓。對於正圓部分與其它的直線,曲線交差接觸的情況,不能抽出正圓。對於圖33的情況,通過抽出正圓可以去除加在右肩上的圓。對於圖44的圓形圖表的情況,亦因為最外周的圓是孤立的圓,所以通過正圓抽取被抽出後,以後就可以從近似計算中除去。
如果抽出正圓就有如下優點。其一,原來是正圓的圖形,即使因噪聲產生一些畸變,由於也按正圓變為數據化處理,所以能夠非常正確地決定完全除去噪聲的形狀。還有,由於圓只用半徑和圓心的坐標就能夠指定,故在數據壓縮這一點上是極其有效的。
所謂正圓是其輪廓點串中各點的曲率全部相等的圖形。利用這個性質可以抽出正圓。圖12中說明了其流程。首先讀入關於曲率K(tuk)的數據,然後,檢查各輪廓點串群u是否構成圓。求關於輪廓點串群u的平均曲率ku。這就是簡單地對曲率求平均值。群序號u應該加括號,但是,因為括號不能加在標註上,所以只寫作u。在圖面上添標有括號。
Ku={∑K=0N-1K(tuk)}/N(31)這就是平均曲率。預先確定曲率的上限ε1,若平均曲率大於ε1,就認為該輪廓點串u群不是正圓。
|Ku|>ε1(32)是包含曲率極大點的情況,與不是圓又不能微分的點和拐點等相對應。這時,將群u表為不是正圓的表示Circle(u)=0。
與此相反,若平均曲率小於ε1,則群u有可能是正圓。因此,從k=0的點開始求點附近的曲率K(tuk)與平均曲率Ku之差的絕對值,並檢查這個值是否小於一定的閾值ε2。如果|Ku-K(tuk)|<ε2(33)則有可能是圓的一部分。於是,對下一個點k=1的曲率同樣也求與平均曲率之差的絕對值並與ε2相比較。這樣,依次對群u的所有點進行比較。只要這個不等式成立,這些點就位於圓弧上。若在某點曲率和平均曲率之差大於ε2,則該點就不再位於圓弧上,包含該點的輪廓點串也就不形成正圓。這時,就對該群標以不是正圓的表示Circle(u)=0。
如果群內所有點的曲率與平均曲率之差都小於ε2,則該輪廓點串就是正圓。因此,就標以是正圓的表示Circle(u)=1。對於所有的輪廓點串群從0~U-1進行這樣正圓的抽取。最後,總起來從群u=0開始對群檢查是否Circle(u)=0。如果所有的輪廓點串群u都是Circle(u)=0,則在這些文字字體、詞符-插圖中設有一個正圓。若有Circle(u)=1,則該群是正圓,可以求出該圓的圓心坐標(X,Y)和半徑r,並把它們輸入正圓存儲裝置G存儲起來。
G.正圓存儲裝置這是用於在前一階段所求出的正圓的圓心坐標和半徑r的裝置。由此,可用3個值記述群u的數據。由於以文字字體、詞符-插圖為對象,所以全部輪廓點串是閉合曲線。對於單重正圓的情況,由於是內部整體用黑象素塗滿的圓,所以是孤立的圓點。對於2重正圓的情況,與2重圓之間用黑象素塗滿的圓圈(はひ
へほ)等相對應。
H.連接點位置抽取機構所謂連接點,就是直線和直線、曲線和曲線、直線和曲線等的連接處。由於是不同斜率的線相接故稱之為連接點。對文字字體、詞符-插圖進行函數近似時,連接點起著極其重要的作用。因此,對於連接點的意義。連接點的作用、連接點的抽取等等必須具有明確的觀念。本發明通過正確適當地決定連接點,可以使文字字體、詞符-插保持高品質,同時使數據量減到最少。
圖13示出連接點抽取過程的概略情況。輸入文字,詞符-插圖後,把它們作為圖象,形成2值圖象後,抽取構成外周的輪廓點串。由此,對得到的各輪廓點串群抽出連接點。
首先,抽取已知道的連接點。這可以按曲率大的點決定。這是臨時連接點,還不是最佳的連接點。還有,僅以這樣的點不能找出所有的連接點。反之,也包含有不必要的連接點。
因此,必須對連接點的指定做修正。然後進行直角部分連接點的抽取、這將在後面敘述,這是為了在文字、詞符-插圖的二條直線交差時使交差點的接續平滑。所謂直線的連接點就是始點和終點,是細線,是在曲率大的條件下追加不顯現的連接點情況。對於文字的情況幾乎不必要,但對於詞符-插圖,常常是必要的。
反之,由於有不必要的連接點,所以必須除去這些點。其中之一就是位於直線中的連接點。如果連接點位於直線的中間,則當到直線的距離比較小時,即使除去該點也能夠保持為直線。因為它是由噪聲產生的連接點,所以除去。另一種是圓弧的連接點。本來應是一個圓弧的曲線,有時會因為連接點多而分離為二個圓弧來表現。這也要除去中間的連接點將圓弧合併成一個圓弧。
並且,當確定了連接點時,就用分段多項式近似各區間。這種分段多項式的近似和前面在數據近似機構A中所述的相同,但是,前面所述的近似區間遍及所有輪廓點串群。現在並不是那樣,而是在每個連接點進行分段多項式近似。
首先,對臨時連接點的抽取進行說明。在連接點處,由於斜率變化,故曲率也大。在接著進行的函數近似時,連接點是決定函數的定義域的。連接點和連接點之間是直線或斜率平滑地變化的曲線。連接點間的近似函數可以用簡單的形式表現。因此,只要求出連接點的坐標和連接點間的近似函數,就可以求出該文字字體的全部數據。
但是,若連接點的選擇不合適,連接點之間過於分離,則由於相鄰連接點之間不能用簡單形狀的近似函數表現,反而增加了數據量。反之,若連接點過多,則由於連接點坐標的數據增加,故不能充分進行數據壓縮。因此,連接點的選擇是很重要的。根據圖14的流程,說明連接點位置的抽取方法。前面已對全部輪廓點串求出了近似曲率,故可以利用它們。
從近似曲率存儲裝置E′讀入曲率,該曲率是{K(tuk)}。根據這些數據順序檢查u群中所有點k=0~N-1的曲率是否大於某個值δ。即,|K(tuk)|>δ(34)所謂連接點,就是斜率是不連續的,並且是曲率大到某種程度的點,所以利用這種方法可以求出。δ的值可以根據不同目的適當決定。
而且,由於構成正圓的輪廓點串已被除去,所以,在圓弧的一部分用這種演算不會出現大曲率的點(不可能是連接點)。
因此,把曲率超過δ的點作為臨時連接點。並且,把這個坐標(xuk,yuk)存儲到連接點位置存儲裝置I中。設臨時連接點的序號為i。因此,第i個臨時連接點可以寫為di(xui,yui)。輪廓點串中的序號k置換為連接點序號i。對於各點k進行這樣的比較和連接點的抽取。對群u進行這樣的處理後,對群u+1進行同樣的處理。這樣就能得到各群內所有臨時連接點的坐標。
下面,直覺地說明連接點。圖15是平假名「あ」和片假名「ボ」的原文字。把它們輸入到圖象處理裝置進行輪廓點串抽取,抽出連接點的圖形示於圖16。標「x」號的地方是連接點。為了無差錯地抽取這些連接點,之後要進行一些計算。
另外,圖17是樂譜音符的例子。左右有2條豎線,上面有2條傾斜地連接豎線的線。豎線的下方連接著2個傾斜的橢圓。(a)是原圖,是黑白圖形。(b)是進行輪廓點串抽取、進而抽取出連接點後的圖形。標有「x」號的點是連接點。在這個例中,有外側輪廓線亻和內側輪廓線口2條輪廓線。
外輪廓線亻具有連接點ハ~ヌ。ハ~二、二~ホ、ヘ~卜、卜~チ、チ~リ、ヌ~ハ是直線。ホ~ヘ和リ~ヌ是自由曲線。內輪廓線口中,ル~ヲ,カ~ワ是直線。ヲ~ワ、カ~ル是圓弧或自由曲線。這個例中直線部分多,能夠把直線按直線的形式正確地抽取出來。當然也包括自由曲線部分。
圖18是半導體二極體的略圖。大的圓形中有三角和線段,有從這些線段中央橫向貫穿的直線。輪廓線有外側圓形的輪廓線ヨ和內側輪廓線レ、ソ共有3條。外輪廓線ヨ的連接點有8個,僅對上半部分標註了符號。ッ、、ネ是短線段,ネ~ナ是半圓弧,ナ~ラ是短線段,ッ~フ是短圓弧或自由曲線、內輪廓線レ、ソ是對稱的,所以對レ進行說明。ム~ウ是線段,ウ~ヰ是線段,ヰ~ノ似乎也是線段,但在ノ的附近為自由曲線。ノ~オ是線段,オ~ク也是線段,ク~ヤ是線段,ヤ~マ是線段,マ~ム是半圓弧。這個圖形直線部分也較多,其次圓弧也較多。在幾何學中線段規定了兩端,直線是沒有兩端的圖形,但在本說明書中把線段和半直線也稱為直線。
當然不是說無論什麼樣的詞符-插圖都是直線多,也有圓弧多的圖形(圖45、圖56)、自由曲線多的圖形(圖51、圖53、圖55、圖57)和多種多樣的圖形。詞符-插圖是由設計者的自由想像創造出來的,所以無法決定其傾向。
I.連接點位置存儲裝置這是存儲由前述操作求出的臨時連接點的序號和坐標di(xui,yui)的裝置。稱為臨時連接點是正確的。關於連接點,有前述以大曲率所選擇的臨時連接點和後面所述的候補連接點以及最佳連接點3種。不能將它們混同。
J.最佳連接點抽取機構前面所求的是僅以曲率的大小判斷的臨時接合點。這些有的並不是實際的連接點。在光學讀取文字字體。詞符-插圖的圖象中,由於透鏡及玻璃對光的反射和散射以及外界幹擾光等存在噪聲,所以實際上有時2條直線、2條曲線的連接點的曲率會變小。因此,按照前面的處理,有時可能沒有以連接點留下來。相反,由於噪聲的影響,儘管是直線、曲線的中間點,有時也因曲率變大而視為連接點。
因而,必須找出最佳連接點。最佳連接點應該位於用前述方法求出的候補連接點附近。所謂最佳連接點,如前所述是直線和直線的交點及拐點等,所以,是文字、詞符-插圖所固有的。由於噪聲的影響,僅用曲率的大小不可能夠正確地找到它們。
圖19示出了最佳連接點抽出機構的流程。從連接點位置存儲裝置I讀入臨時連接點di(xyi,yui)i=0I=1。這裡,u是輪廓點串的群序號,i是該群中臨時連接點的序號,I是該群中臨時連接點數。稱為臨時連接點是因為這不是最終的連接點。本發明的顯著特徵也在於此,對於連接點的位置反覆推敲這一點,在本發明中是很重要的。
考慮臨時連接點附近的幾個稱為候補連接點的點。設它們為λi。加上坐標寫為λi。(xio,yio)。i是臨時連接點的序號,應該放在括號內作為上標,但因括號不能形成1/4角,所以省略。在圖面正確地書寫為(i)的標註。省略了群u的表示。當然是群u中第i個臨時連接點附近的候補連接點。設候補連接點的數為0。這對任何臨時連接點都是相同的數。圖20示出了這種表示方法。
中央的xi是根據曲率所選擇的臨時連接點,其前後α個是候補連接點。不過,這裡寫為xi的就是di(xui,yui)包括x坐標和y坐標2個坐標的意思。雖然可以寫為di,但這裡為了清楚地表示是位置坐標的意思,所以簡單地寫為xi。後面出現的附近連接點的表記也是同樣的。
候補連接點有o=0,1,…,0-1個。這由di+α或di-α求出的。這是把臨時連接點前後α個輪廓點串作為候補連接點的結果。由於臨時連接點也和它對應,故0=2α+1。其中存在一個最佳連接點。根據臨時連接點與最佳連接點偏離的大小的評價來決定,偏離大時必須增大α。但是,如果增大α,後面的計算量就要增加。因此,應該兼顧兩方面決定適當的數。
接著,根據這個數抽出近旁連接點{di(xui,yui)}。近旁連接點是位於以臨時連接點xi為中心、半徑為ρ的圓內的臨時連接點,是由連續的輪廓點串所聯繫的點以及位於由包含這個臨時連接點的輪廓點串所包圍的輪廓點串內的點。例如,對於「 」這一文字的情況,右下角的○的內側輪廓點串也形成外側臨時連接點的近旁連接點,對於圖33的詞符-插圖的情況,如最下段所示的包含在○內部的臨時連接點サ、
、テ成為近旁連接點。
設對近旁連接點標的序號為j。成為先前考察對象的臨時連接點xi以i為序號,以示區別。所謂位於半徑ρ內,可以用條件{(xi-xj)2+(yi-yj)2}1/2<ρ(35)表示。需要「由輪廓點串聯繫著」這個條件,是因為最佳連接點的抽出,在線與線的交差處為了使連接點之間光滑地相聯繫。沒有由輪廓點串聯繫著的連接點之間的相對關係,無論如何都可以。另外,由輪廓點串(黑象素的連結)聯繫的這一條件可以利用xj與xi是否在一個輪廓點串群中簡單地進行檢查。
近旁連接點應該正確地寫為xj(xuj、yuj),但由於太冗長,故以後簡單地寫為xj。這不單純只是x坐標,也包含y坐標的意思。
設近旁連接點的數為J。J有時為0,有時大於1。J=0時,沒有近旁連接點。J大於1時,有幾個近旁連接點。對於兩種情況的處理不同。下面,分為J≥1和J<1(即J=0)的兩種情況進行說明。
J≥1時,進一步分為兩種情況。輪廓點串的跟蹤,在外部有輪廓點串時,順時針旋轉,位於內部時,逆時針旋轉。所以,有的近旁連接點xj位於成為考察對象的臨時連接點xi之後,有的近旁連接點xj位於xi之前。必須區別二者。
位於用曲率選擇的臨時連接點xi之前的近旁連接點xj稱為輸出近旁,如圖21所示。位於臨時連接點xi之後的近旁連接點xj稱為輸入近旁。即,位於從臨時連接點xi向輪廓點串掃描方向發出的向量走出去的前端的近旁連接點是輸出近旁。相反,從近旁連接點向掃描方向發出的向量進來的臨時連接點是輸入近旁。關於輸出近旁和輸入近旁的判斷在後面進行說明。
情況1.(J≥1,輸出近旁的情況)首先,根據圖21考慮輸出近旁的近旁連接點。可以有幾種考慮方法。這裡,考慮4個臨時連接點的近旁。並且,根據聯繫這4個點的曲線為最光滑的這一條件,決定臨時連接點附近的候補連接點λi。(xio,yio)中的最佳點。
圖21中,最初根據曲率所選定的臨時連接點是xi(C的附近)。近旁連接點是xj(B的附近)對於輸出近旁的情況,考慮臨時連接點的下一個臨時連接點xi+1(D的附近)和近旁連接點xj之前的一個臨時連接點xj-1(A的附近)。連接這些點,使通過這4個點的曲線最光滑,這4個連接點內,兩側的A、D固定,僅移動中間的B、C求適宜係數。B、C點具有2α+個候補連接點。於是,進行(2α+)2個組合的分段多項式近似。其中,最光滑地聯結4個點的近似給出最高的適宜係數。
有幾種方法表現光滑這一條件,但是,此處採用根據曲線的拐點最少這一條件進行評價。以逐次近似為例,用t表示近似的次數。
曲線的端點A是xj-1中某個候補連接點λj-1(xj-(l),yj-(l))。不過,這裡候補連接點的角標是1′,但因「′」號不能用於1/4角格式,故在此寫為1。實際上是1′。
中間點B是近旁連接點xj的某個候補連接點λjl(xj1,yj1)。候補連接點的序號用1表示。1是一個參數,改變1要進行若干次相同的計算。
中間點c是原來的臨時連接點xi中某個候補連接點λio(xio,yio)。候補連接點的序號用o表示。o是一個參數,改變它要反覆若干次相同的計算。
曲線的另一個端點D是xi+1中某個候補連接點λi+1o(xio,yio)。不過,這裡候補連接點的角標是o′,但是由於「′」號不能用於1/4角格式,故在此僅寫為o。實際上是如圖21的o′。
以上是計算的順序,但是,由於兩端的A、D點是固定點(在第t次近似中),所以,對於中間點B的候補連接點Xii(xil,yil)、中間點c的候補連接點λio(xio,yio)逐次改變參數l、o反覆進行計算。在這個計算中把作為連接點的適宜性視為概率函數進行計算。概率函數具有由曲線光滑性決定的係數rij(ol)。可以把這個係數稱為適宜係數。i和j是臨時連接點xi和近旁連接點xj的符號。
o和l是這些臨時連接點所屬的候補連接點的序號。由於係數是對每個參數o、l決定的值,因而必須有這些角標。在曲線ABCD足夠光滑時為1,不光滑時小於1。所以可以成為決定曲線適宜性的參數。
圖22是表示存在近旁連接點時(J≥)的適宜係數rij(ol)決定法的流程圖。首先指定參數的範圍。
i從o變到I-1,對於根據曲率所求的臨時連接點xi就是從0到I-1反覆進行這種計算。
0從0變到2x,就是在作為對象的臨時連接點xi中有2α+1個候補連接點,故對它們一個一個地進行計算。
i從0變到J-1,就是有多個近旁連接點xj時,要全部對它們反覆進行這種計算。因為J大於1,所以必須如此處理。
1從0變到2α,就是在鄰近連接點xj中有2α+1個候補連接點,故對它們一個一個地進行計算。
雖然對i、o、j、l各參數進行這樣的計算,但這裡,書寫的順序不同,並不是越靠前面的參數構成的循環越大。但是,根據以後的說明,可以唯一地給這些參數的變化。
首先,根據與數據近似相同的方法,用光滑函數近似點A、B、C、D。即,用分段多項式進行近似。近似函數的次數為2次就足夠了。在前述的公式中,取m=2,則Sx(t)=∑k=-2M+2Cxkφk(t)(36)Sy(t)=∑k=-2M+2{-M+2Cxkφk(t)}(37)
φK(t)=3(T/M)-2∑q=03(-1)q{t-(k+q)(T/M)}2+/{q!(3-q)!}(38)k=-2,-1,0,1,2,……,M+2(39)這裡,參量t是表示連接量的to與前面所講的表示近似次數的t不同。由於字符數不夠,故用同一個t表現不同的量。
最初的數據近似時,對全部輪廓點串確定範圍T,對全部輪廓點串給出一個近似。所以,必須參照所有輪廓點串的坐標數據。
然而,此處不是那樣,只要聯結4點ABCD就可以了。只需要4點的坐標,不需要4點間眾多的輪廓點串的坐標。由於只要聯結4點就可以了,故用分段多項式近似AD。區間T與曲線AD對應。雖然進行圖10所示的計算,但因點數明顯減少,故這種近似很簡單。用最小二乘法確定係數時也相同。利用這樣的近似可以作通過4點的近似曲線ABCD。
下面,計算曲線ABCD的各輪廓點處的曲率。由於有近似函數Sx(t)、Sy(t),所以有K(tuw)={Sx′(tuw)Sy″(tuw)-Sx″(tuw)Sy′(tuw)}/{Sx′(tuw)2+Sy′(tuw)2}3/2(40)式中,w=A、B、C、D這不用遍及整個曲線AD求曲率,只計算4點就行,因而很簡單。
下面,根據曲率的反轉次數求拐點數nc。拐點數當然小於3。圖23是曲線的大致形狀和拐點數nc的示例圖。用「X」號表示拐點。(a)是拐點數為3的情況,曲折明顯。(b)是拐點數為2的情況,(c)是拐點數為1的情況,(d)是拐點數為0的情況。這是最光滑地聯結4點的情況。採用這個形式是所希望的。這時,規定rij(ol)為1。例如,用拐點數nc,可以按下式決定rij(ol)=min{1/c2(nc-c1),1}(41)(c1、c2は定數)(c1,c2為常數)在本例中,拐點數為3時,rij(ol)=1/3。這是取c1=-1、取c2=3/4的結果。於是,n2=2時為4/9,nc=1時為2/3,nc=0時為1。當然可以適當決定這些常數。1和min的演算是為了防止在拐點數過少時計算值過大,但是,並不是說rij(ol)的上限必須為1。也可以僅用公式rij(ol)=1/c2(n2-c1)計算。
重複若干次這種計算。用t表現近似計算次數。這是求概率的計算。關於近似計算將在後面將敘述。這裡,僅就適宜係數rij(kl)決定進行了說明。
情況2,(J<1時,沒有近旁連接點)圖24示出了J>1,即不存在近旁連接點時的處理流程。圖25示出了這種情況下連接點位置的例子。這是臨時連接點Xi之前的臨時連接點Xi-1和其後的臨時連接點Xi+1的3點聯結的問題。圖24的流程中開始也定義了參數的範圍。
i從0~I-1,是臨時連接點的序號,對所有的臨時連接點進行演算。k是臨時連接點Xi的候補連接點λik(Xik、yik)的序號。1是Xi之前的臨時連接點Xi-1的候補連接點λ(i)1(Xi-11、yi-1)的序號。對所有的候補連接點進行計算。j是i-1~i-1,即,j僅是j=i-1。
設各個臨時連接點的臨時連接點Xi-1、Xi、Xi+1的候補連接點為A、B、C。點A是λi1(Xi-1
、yi-1
),1是參數。點B是λik(Xik、yik),參數是k。點c是Xi+1的候補連接點λih(Xih、yih),表示,maxh(pt-1i+1h),maxh表示參數h中的最大者。
用光滑函數插值這3個點。雖然用圖10所示的方法進行,但只有3個點,故極其簡單。然而這也要提高近似程度,用t表示近似次數。並且,近似到最小二乘法的誤差達到εmax。這時,設近似的因次數為M。rij(ol)由min{1/(c3m+c4ε,1}決定。ε是最終誤差,M是最終因次。
即,要求出能以儘可能低的因次,很小的誤差進行近似的點。這樣的點可以在分別屬於各臨時連接點的候補連接點內給出最光滑的曲線。t是近似次數,從0開始上升。與前面說明的J≥1時相同,t從0-4,在4次停止近似。
情況3,(J≥1,輸入近旁的情況)圖21中所示的是J≥1時對於臨時連接點Xi的近旁連接點Xi為輸出近旁的情況。J≥1時,近旁連接點Xj為輸入近旁的情況也進行同樣的計算,但這時,4個點的取法稍有不同。
圖26地出了輸入近旁情況下對於近旁連接點Xj取4個點的方法。近旁連接點Xj位於以Xi為中心的半徑ρ內。而且對於掃描方也使用另一均為單-乙烯-醋酸乙烯酯形式的下列添加劑。
下列各物用作助添加劑。
極性氮化合物(添加劑F)1摩爾鄰苯二甲酸酐與2摩爾二氫化牛油胺反應生成的反應產物半醯胺/半胺鹽,即2-N』,N-二烷基醯胺基苯甲酸的N,N-二烷基銨鹽。
梳狀聚合物(添加劑G)單體含16個碳原子線型烷基,將單體溶在環己烷中用游離基催化劑進行聚合反應所得到的數均分子量約為4000的衣康酸酯聚合物,此數均分子量用凝膠滲透色譜法(GPC)測得。
i是計算對象即臨時連接點Xi的序號。對於一個輪廓點串群u有I個序號(0~I-1),從i=0開始。j是近旁連接點的序號,當然不是從一開始就知道是否為近旁的。開始,全部為臨時連接點Xj。o是包含在臨時連接點附近2α個之內的候補連接點的序號。圖中,o上加有上橫線,但在說明書中未加橫線,省略了僅固定臨時連接點Xi的i,決定近旁連接點。
di(xuj,yui)是第j個臨時連接點的坐標,為簡單起見寫為dj。檢查di是否在以λi0(Xi0、yi0)。(為簡單起見,寫為λi0)為中心的半徑ρ內。這裡(35)式中已示出的條件,現在再次記述如下{(xio-xj)2+(yio-yj)2}1/2<ρ(42)(35)直接使用了臨時連接點的坐標Xi,這裡使用Xi的候補連接點的坐標。如果dj位於半徑ρ內,則該點有可能是近旁連接點。其次,檢查dj和λ0是否位於同一個輪廓點串。如果位於不同的輪廓點串,它們就不是近旁連接點。
如果位於同一個輪廓點串,dj就是λi0所屬的臨時連接點Xi的近旁連接點。用di表示Xi。在作為對象的臨時連接點Xi,可以用di-b表示某一常數b前面的點的坐標(不一定是候補連接點)。向量di-bdi的方向在臨時連接點沿掃描方向。但b在圖中是β,由於β不能成為1/4角格式,故在此寫為b。b應該改讀為β。另外,由於在文字上面不能加→號故在這裡寫為標量。
一方面,在近旁連接點Xj可以把位於其後一定數b的點的坐標寫為dj+b。向量djdj+b的方向在近旁連接點之後沿掃描的方向。計算這些向量的標積。標積很小時,這些向量幾乎正交。即,如果向量didi+b·向量djdj+b<ε(43)則兩者幾乎正交。式中,ε是適當小的數值。這時,dj是輸入近旁。於是,把它作為dinputj(i)進行存儲。
另一方面,在近旁連接點Xj,可以把位於其前面一定數b的點的坐標寫為dj-b。向量djdj-b的方向在近旁連接點之前沿掃描的方向。計算這些向量的標積。標積很小時,這些向量幾乎正交。即,如果向量djdj+b·向量
<ε(44)二者幾乎正交。式中,ε是適當小的數值。這時,dj是輸入近旁。於是,把它作為doutputj(i)進行存儲。
以上所說明的是利用向量標積的情況,也可以利用向量的矢積。使用矢積時,可以找到平行的向量,即|向量di-bdi×向量dj-bdj|<ε(45)|向量didi+b×向量djdj+b|<ε(46)等等。另外,若用以上方法還不能知道輸出近旁和輸入近旁的區別,則計算標積向量di-bdi·向量dj-bdj<ε(47)向量didi+b·向量djdj+b<ε(48)確定這些標積的正負後,就能區別輸入、輸出近旁。為了求最佳連接點,對候補連接點進行以下的計算,以選擇最佳點。圖28是表示這一計算的流程。輸入的是λio(xio,yio)、dinputj(i)、doutputj(i)(49)λi0(Xi0、yi0)是根據曲率所選定的臨時連接點Xi附近的候補連接點。o是候補連接點的序號。i的意思是關於Xi的量。dinputo(i)是臨時連接點Xi的近旁連接點中的輸入近旁連接點的位置坐標。doutputj(i)是Xi的近旁連接點中的輸出近旁連接點的位置坐標。
開始時先輸入這些值。用t表示計算概率的次數。這不是當用最小二乘法決定的誤差小到某種程序時中止計算,而是從開始就預先決定次數。例如取4次(t=0-4)。當然根據目的不同也可以取5次以上。
定義概率變量pti(O)。這是位於臨時連接點Xi附近的2α+1(包括Xi自身)個候補連接點內0的第t次概率。不是t次方而是第t次,所以應該加括號。但由於不能把括號加在標註上,所以只寫為t。這裡說的概率是作為最佳連接點的概率。在2α+1個候補連接點內,選擇它的概率最高的點。每增加概率計算的次數t,對於連接點,就提高了更適宜的概率變量。這樣,就可以決定概率變量。當然,可能有幾種定義。在這裡,按如下決定。考慮互補概率變量Qti(o)。這個變量也給出候補連接點0的第t次概率,這是輸入近旁的貢獻qinputi(o)與輸出近旁的貢獻qinputi(o)之和。這些值也計入了t次,但此處省略。
Qti(o)=qinputi(o)+qoutputi(o)(50)qinputi(o)和qoutputi(o)定義如下qinputi(o)=max{rij(ol)×Ptj(l)}(51)(λjl∈dinputj(i))(52)式中,max的計算,在候補連接點λj1屬於dinputj(i)的候補連接點這一條件下取最大值。這裡,l是變化的參數。適宜係數rij(ol)已在前面給出。同樣,qoutputi(o)=max{rij(ol)×Ptj(l)}(53)(λjl∈doutputj(i))(54)max的計算,在候補連接點λjl屬於doutputg(i)的候補連接點這一條件下取最大值。
第t+1次的概率變量是用第t次的概率變量、互補概率量等按如下定義的。
Pt+1i(o)=Pti(o)Qti(o)/{∑Pti(o)Qti(o)}(55)(∑是對λi0進行求和)。
在t=0-4進行這個計算。但是,初始(t=0)的概率變量不知道時不能計算。雖然初始概率不管怎樣賦值都可以,但是此處賦予儘可能接近Xi的較大值。因為一般認為最佳連接點位於臨時連接點Xi的附近,如果提高Xi的初始概率,就可能提高概率變量的收斂速度。
圖30中說明了初始值的設定。候補連接點λi0有2α+1個。從0開始。o=α時,就是Xi本身。初始值Pi′(o)在o=α時取最大值k。0=α-1,α+1時取(k-2)。以後,隨著遠離α,每次減少2。在o=0、2α時,初始值是1。使用初始值時,初始概率P(o)i(0)為Poi(o)=Pi′(o)/∑Pi′(o)(56)∑的運算對0進行求和。這樣,由於給出了初始概率,所以,和適宜係數rij(ko)組合後,就可能計算t=1時的qinputl(o)和qoutputi(o)。作為它們的和,可以計算互補概率變量Qti(0),以及進而計算第t+1次的概率變量pti(o)。反覆進行這一計算直到t=4。在t=4時,具有最高概率變量的候補連接點就是最佳連接點。這裡的輸出是p4i(0)i=0I-1o=00-1,示於圖31。
這樣,就能根據位於由概率求出的臨時連接點附近的候補連接點求出最佳連接點。開始時,先求臨時連接點,進而把範圍擴大到該點附近的輪廓點中,作為候補連接點,從中求出最佳連接點,這就是本發明的顯著特徵之一。這是基於本發明者發現,曲率極大的點作為連接點,不一定是最佳的。
〔適當係數的其它定義〕在前述方法中,最佳連接點的條件是連接4個點的曲線的拐點最少,即最光滑地接續。除了計算拐點數外也可以直接採用以曲線的曲率為對象的方法。圖29是表示這種根據其它條件求候補連接點適宜係數方法的流程圖。
開始的J>1是存在近旁連接點的條件。這時,考慮輸入近旁和輸出近旁,考慮過4個點A、B、C、D的曲線(圖21,圖26),但是,這時不是求拐點而是求曲率。Kinput是在輸入近旁聯結4點的曲線的最大曲率。所希望的是曲率變小的曲線。Koutput是在輸入近旁聯結4點的曲線的最大曲率。這也是較小為好。為此取二者之和,求給出最小值的點。因此,定義適宜係數如下rij(ol)=min{γ(Kinput+Koutput)-1,1}(57)r是常數。它是在最佳時曲率之和幾乎等於r這一要求決定的。
圖31表示反覆計算概率變量,當t=4時中止反覆,求出所得到的概率變量P4i(0)為最大的候補連接點的序號o,並把它作為前述臨時連接點xi所屬的候補連接點內的最佳連接點λi0,然後,把它輸入最佳連接點存儲裝置K中。對輪廓點串群的所有臨時連接點進行這樣的操作,可以決定各類最佳連接點。
K.最佳連接點存儲裝置這是存儲利用上述操作求出的全部最佳連接點的裝置。如圖31的最後一步所示,把最佳連接點作為(xui,yui)進行存儲。u是輪廓點串的序號。i是群u中的連接點的序號。前面對臨時連接點標以Xi的序號(也代表y坐標),雖然序號i相同,但沒有關係。因為一個臨時連接點對應一個最佳連接點,並且最佳連接點與前面所求的臨時連接點相同,或者極為接近。
按照順序說明了至此的操作,但是為了易於了解步驟,這裡以圖32所示的「ぱ」字為例,簡單回顧前面的操作。圖32中有黑體的「ぱ」字。用圖象掃描器讀入,作為圖象。在經過圖象處理後,進行輪廓點串抽出。用黑框白底字表示。右肩上的圓圈利用正圓抽出除去,並用正圓存儲裝置進行存儲。
餘下的變為「は」。作為輪廓點串有獨立的3個群。遍及它們的全長進行分段多項式近似,並且,計算曲率後求臨時連接點。這些畫在第3步中。臨時連接點出現在線段的接頭處。
在第4步用「×」號表示臨時連接點。由於利用曲率進行選擇,所以「は」的右下部分有時出現臨時連接點。這時,要將該點追加為連接點。接著,求候補連接點。進而在「は」的下部的交差點部分抽出近旁連接點。根據以上的說明,至此為止的過程是清楚的。
其次,以圖33所示的詞符-插圖為例,同樣簡單地回顧前面的操作。這是在圖18、圖50的半導體二極體圖形的右肩添加了多餘的「o」的圖形。這是為了說明正圓的處理。用圖象掃描器讀入這一原圖,形成圖象。經過圖象處理後,進行輪廓點串的抽取。用黑框白底的詞符-插圖表示這一圖形。有5個輪廓點串。右肩上的圓圈利用正圓抽取除去,存入正圓存儲機構。由於去除了圓圈,所以,減少了2個內外同芯的輪廓點串。
餘下的是由圓和三角、線段組合的圖形。作為輪廓點串有3個獨立的群。遍及輪廓點串的全長進行分段多項式近似。並且,計算曲率後求臨時連接點。這些畫在第3步中。臨時連接點出現在線段的接頭處。
在第4步中,用「×」號表示臨時連接點。由於利用曲率進行選擇,所以有時在本來應該成為連接點的地方2個線段也以鈍角交叉時,不出現臨時連接點。這時,要將該點追加為臨時連接點。在本例中,由於利用曲率計算全部出現臨時連接點,所以不需要追加連接點。接著,求候補連接點。然後,以圓和橫直線的交差點、縱線段和直線的交差點等作為一定半徑內的臨時連接點,抽取近旁連接點。根據以上的說明,至此為止的過程是清楚的。
L.連接點去除機構在這裡,是除去前面抽出的連接點內不必要的連接點。圖34是表示該過程的流程圖。從最佳連接點存儲裝置讀入最終連接點,是{λio}={(xui,yui)}i=0I-1u是群序號,i是群中連接點的序號。然後,除去直線近似中冗長的連接點。
進而,除去在圓弧近似中冗長的連接點。對於每個輪廓點串利用坐標(xui,yui)和序號i′把最終連接點存儲到存儲裝置中。
前面所求的連接點是用分段多項式近似輪廓線、求曲率、求臨時連接點,再從候補連接點中求出的最終連接點。因此,應該幾乎沒有不必要連接點,但是由於圖象噪聲的影響等,可能存在不必要的連接點。這就是直線的連接點和圓弧的連接點。
〔直線的連接點的除去〕圖35的輪廓點串的例子示出了在線段中有連接點的情況。利用(Xi4B,yi4B)表現這個點的坐標。順次評價這個連接點。存在直線的連接點大於2的連續區間時,在該區間內取3個連續的點串設i4=ns、ns+1、ns+2。用直線連接兩側的(XnsB、YnsB)和(Xns+2B、Yns+2B)。設從中間的連接點(Xns+1B、Yns+1B)向這條直線所做的垂線長度為Lns+1。這個長度上預先確定的常數K7時,Lns+1<K7(58)則除去這個連接點。圖36示出了除去該連接點後連接兩側連接點的狀態。
反之,垂線的足Lns+1大於常數K7時,Lns+1≥K7(59)則保留該連接點。對於所有的連接點都進行這樣的評價。
〔圓弧的連接點除去〕在前面抽出的圓弧的連接點中,有時多個連接點連續。這時,即使除去中間的連接點,也能保證數據的品質時,就除去該連接點。判斷除去的可能性按如下方法進行。如圖37所示,用(Xi4B,Yi4B)表示圓弧的連接點。i4是連續的序號。
如圖37那樣,設連續存在3個連接點(xnsB,ynsB)、(Xns+1B、Yns+1B)、(Xns+2B、Yns+2B)。這時,考慮從(XnsB、YnsB)開始的圓弧(メ)和從(Xns+1B、Yns+1B)、開始的圓弧(ミ)。如圖38所示,設兩圓弧的半徑為rns、rns+1。設它們的中心坐標分別為(xns、yns)、(xns+1,yns+1)。圓弧メ,ミ滿足如下條件時,可以看作是單一的圓弧。
|rns+1-rns|<K8(60){(xns+1-xns)2+(yns+1-yns)2}1/2<K9(61)即,如果中心座標幾乎為同一點,且半徑幾乎相同時,則2個圓弧メ,ミ視為同一圓弧的一部分。這時,中間的連接點(Xns+1B、Yns+1B)、可以作為不必要的點而除去。否則,就保留該連接點。
對全部圓弧的連接點順次進行這種判斷、除去、保留的作業。雖然應適當地決定半徑差、中心差的閾值,但是例如定為K8=1,K9=2就可能了。
利用以上的操作,可以除去直線和圓弧上的不必要的連接點。這對於壓縮數據是有效的。不僅如此,而且由於還把應該是直線和圓弧的圖形修正為所應有的形狀,所以在提高數據的品質方面具有積極的意義。這樣選定的連接點稱為最終連接點。
M.最終連接點存儲裝置這是存儲除去不必要的連接點後得到的最終連接點的裝置。如圖34的最後一步所示,坐標(xui,yui)。但是,由於在圖面中,為了與最佳連接點區別加有「′」號。由於「′」號不能形成1/4角格式,故在說明書中省去。實際上是加有「′」號的。
N.數據近似機構這是根據前面得到的輪廓點串、最終連接點、正圓等數據來近似數據的機構。是本發明的核心部分。從各個存儲裝置中輸入的數據,如圖39所示,分別是輪廓點串存儲裝置…輪廓點串{(xuk,yuk)}k=0Nu-1=0U-1最終連接點存儲裝置…最終連接點{(xui,yui)i=0I-1正圓存儲裝置…圓Circle(u)輪廓點串的標就u是輪廓點串群的序號。k是該輪廓點串群內的輪廓點串的序號。N(u)(寫為Nu)是群u內的輪廓點串數。i是群u內的最終連接點。只寫為i,但實際上如圖39所示是i′。由於「′」號不能形成1/4角格式,故在此省略。雖然可以得到最終連接點,但是把相鄰的2個連接點之間(連接點間)進行直線、圓弧、自由曲線近似。在近似中,用參變量t把x分量用Sx(t)表示,y分量用Sy(t)表現。
這和最初用參變量t表現整個輪廓點串的方法是相同的。但是現在區域成為連接點之間,所以t的範圍和t與Sx(t)、Sy(t)的對應關係就與前面的不同。還有,從某連接點開始的區間是直線區間。還是圓弧區間或自由曲線區間,求出各點的曲率就知道了。
在存儲了這些信息時,則從開始就能區別是直線還是圓弧或自由曲線。即,如果該區間的所有點的曲率為o,則這就是直線。另外,如果該區間的曲率為一定值,則這就是圓弧。進而,如果曲率變化,則這就是自由曲線。若能像這樣區別區間,則決定近似計算的參數就比較簡單了。
但是,反過來,即使沒有存儲曲率計算的結果,在這個階段也能檢查直線、圓弧及自由曲線的區別。區別之後也可以進行近似。
不論哪種情況,本發明都能適用。下面,對前者的情況進行說明。
〔直線區間的近似〕對從直線的連接點開始的區間的近似進行說明。在連接點抽取階段,已判斷為直線。這時,x方向的近似曲線Sx(t)成為聯結始點x11和終點xn3的一次函數。y方向的近似曲線Sy(t)成為聯結始點y1和終點yn3的一次函數。這時,對於參變量x、y都成為一次函數。
參變量t與Sx(t)、Sy(t)的比例常數變為參數。但是,沒有必要存儲這個比例常數。這是因為,若是直線區間,則只要知道始點(x1,y1)和終點(Xn3,yn3)就可以在這兩點之間引直線。另外,由於終點(Xn3,yn3)作為下一個區間的始點給出,故沒有必要進行存儲。
〔圓弧區間的近似〕對從圓弧的連接點開始的區間的近似進行說明。這個區間在連接點抽取階段,已判斷為圓弧。表示圓弧的近似曲線Sx(t)、Sy(t)可用如下三角函數的線性組合表示。設觀測區間為t∈(0,T),則Sx(t)、Sy(t)可以表示為sx(t)=Axcos(2πt/(T/narc))+Bxsin(2πT/(T/narc))+Cx(62)sy(t)=Aycos(2πt/(T/narc))+Bysin(2πT/(T/narc))+Cy(63)narc是圓弧與整個圓之比。即,是以360度除圓心角得到的值。例如,對於4分之一圓的情況,narc等於1/4。所以,2πnarc是該圓弧的圓心角。變量2πt/(T/narc)是從圓弧的始點到與參數t對應的點的圓心角。(Cx,Cy)是圓弧的中心的坐標。這時,如果關係式A2x+B2x=A2y+B2y(64)By/Ay=Bx/Ax(65)成立,則近似函數就是圓弧。這時,規定圓弧的參數是函數各個係數Ax、Bx、Ay、By、Cx、Cy、narc。如果從開始就知道該區間是圓弧,則根據始點、終點的坐標、曲率、中間一點的坐標可以唯一地決定這些參數。
〔自由曲線的近似〕對既不是從直線的連接點,也不是從圓弧的連接點開始的區間自由曲線近似。雖然可用參變量t表示,但輪廓點串用(xi3u、yi3u)表示。使其與t相對應,可用參變量t表示為(ti3u、xi3u),(ti3u、yi3u)。前面輪廓點串的下標是k,但是,由於這裡用k作為區分區間的序號,故代替k用i3作為輪廓點串的序號。並且,設輪廓點串的總數為n3。
以2次光滑函數為底展開Sx(t)、Sy(t)。關於光滑函數如圖46所示。它是只在3個小區間有值的函數。把區間取為(0,T),則2次光滑函數ψk3的M維函數係為φk3(t)=3(T/M)-2∑q=03(-1)q(t-ξk+q)2+/{(q!(3-q)!)}(66)k=-2,-1,0,1,2,···M+2以該函數為基底,利用係數,Sx(t)、Sy(t)可以表示為sx(ti3)=∑k=-2M+2cxkφk3(ti3)(67)sy(ti3)=∑k=-2M+2cykφk3(ti3)(68)這裡,定義t>ξk+q時(t-ξk+q)2+=(t-ξk+q)2(69)t≤ξk+q時(t-ξk+q)2+=0(70)ξk+9是將區間T作M等分時的小區間。
ξk+q=(k+q)T/M(71)係數Cxk、Cyk通過使各輪廓點串的值(xi3u、yi3u)和Sx(ti3)、Sy(ti3)的值近似來決定。利用最小二乘法決定係數的值。平方誤差Q定義為Q=∑i3=1n3|xi3u-sx(ti3)|2-∑i3=1n3|yi3u-sy(ti3)|2(72)為了使其為最小值,利用下式決定
∑k=-2M+2cxk{∑i3=1n3φk3(ti3)φm3(ti3)}=∑i3=1n3xi3φm3(ti3)(73)∑k=-2M+2cyk{∑i3=1n3φk3(ti3)φm3(ti3)}=∑i3=1n3yi3φm3(ti3)(74)m=-2,-1,0,1,…,M+2(75)求解上面的關係式,可以求出係數Cxk、Cyk。為了評價該係數是否適當,按下式求各點誤差的最大值。
ε=maxi3=0n3{(xi3u-sx(ti3))2-(yi3u-sy(ti3))2}1/2(76)其中,在max的演算中,i3的範圍從0到n3-1,求這個範圍內的最大值。若ε小於某常數,就可以近似。例如,根據是否ε<0.9進行判斷。如果ε大於某一常數,就把因次數M加1,進行同樣的計算。提高因次數,就增加了區間數,所以可以提高近似精度。進行同樣的誤差計算,則在某時達到ε<0.9。這時,近似計算即告結束。
O.壓縮數據輸出機構這是利用前面的程序把文字字體、詞符-插圖的輪廓線分離為直線(線段)、正圓、圓弧、自由曲線。它們有始點、終點,還有斜率、圓心、半徑等等參數。根據種類不同,應存儲的數據也不同。
對直線數據的情況,把表示直線的圖、直線的始點坐標作為數據進行存儲。終點坐標作為下一個區間的始點給出,所以這裡不需要存儲。直線的斜率是定義直線的參數,但通過連結始點和下一個連接點的坐標,能夠得到直線,所以也不需要斜率,也不需要存儲。
對於正圓數據情況,可以從正圓存儲裝置G直接得到數據。這些數據已用第1次的數據近似機構A選擇出來。對於正圓,把表示正圓的圖、圓心坐標、圓半徑作為數據進行存儲。
作為圓弧數據,把表示圓弧的圖、圓弧始點坐標、圓弧的分割長度(圓弧長/周長)、輪廓點數和函數的係數進行存儲。
作為自由曲線的數據,存儲函數的因次,輪廓點數,輪廓點串變化的中點及函數的係數。
P.壓縮數據存儲裝置這是存儲從壓縮數據輸出機構輸出的直線、正圓、圓弧、自由曲線等數據的裝置。存儲這些數據後,在適當的時候輸出。這是將數據壓縮並進行存儲的裝置。後面將說明根據存儲的數據再生文字的裝置。
存儲在壓縮數據存儲裝置P中的數據結構示於表1。
下面,對數據的大小進行說明。連接點間是直線時,用於表示直線的圖需要1位元組,表示線段的始點需要2個字節(x坐標和y坐標),共需要3個字節。連接點間是圓弧時,表示圓弧的圖需要1個字節,表示圓弧的始點需要2個字節,表示圓弧的圓心角需要4個字節,表示輪廓點串數需要1個字節,表示近似函數的係數(有6個)需要12個字節,總共需要20個字節。連接點間是自由曲線時,表示函數的因次M需要1個字節,表示輪廓點數需要1個字節,表示輪廓點的變化中心需要2個字節,表示近似函數的係數需要2M個字節,合計為4+2M個字節。
下面說明的輪廓再生機構R、文字、詞符-插圖再生機構S、再生數據輸出機構T構成用於以任意的大小再生文字體、詞符-插圖的再生數據生成裝置。
R.輪廓再生機構這是根據存儲的壓縮數據再生應成為文字字體、詞符-插圖的骨架的輪廓線的機構。輪廓線有直線、正圓、圓弧和自由曲線等情況。
〔直線的再生〕直線的再生通過用直線從始點的坐標連結到下一個區間的連接點的坐標來進行。不需要關於直線的斜率的數據。
〔正圓的再生〕正圓的再生根據圓心坐標和半徑的數據,通過描述以圓心坐標為圓心給定半徑的圓進行。
〔圓弧的再生〕圓弧的再生通過把所存儲的各數據(Ax,Bx…)代入下式進行。
Sx(t)=Axcos{2πt/(T/narc)}+Bxsin{2πt/(T/narc)}+Cx(77)Sy(t)=Aycos{2πt/(T/narc)}+Bysin{2πt/(T/narc)}+Cy(78)通過使參數t在(o~T)的區間內變化,可以根據Sx(t)、Sy(t)得到x、y坐標。
〔自由曲線的再生〕標本點ti處於區間((L-1)(T/M),L(T/M))內時(1≤L≤M),利用p=L-ti×M/T,各標本點ti的近似函數基底ψk3的值可以表示為φk3(ti)=0.5p2k=L(79)φk3(ti)=p(1-p)+0.5 k=L+1(80)φk3(ti)=1-φL3(ti)-φL+13(ti) k=L+2(81)φk3(ti)=0 k≤L-1,L+3≤k(82)式中,L是小於因次數M的自然數。由於是同一性質的數,所以應寫為M′,但是,由於「′」號不能成為1/4角格式,故用L表示。
利用這樣的基底ψk3,各標點的近似函數值S(ti)可以由下式求出。
S(ti)=∑k=LL+2Ckφk3(ti)(83)S.文字、詞符-插圖再生機構這是再生文字形狀、詞符-插圖形狀的機構。由於得到了輪廓線,所以把輪廓線所包圍的部分作為黑象素,形成黑白2值圖象後,再生為文字形狀、詞符-插圖的形狀。或者相反,也可以把輪廓所包圍的部分作為白象素,把其餘的部分作為黑象素。進而,還可以把輪廓線所包圍的部分作為某種彩色象素,把其它部分作為另一種彩色象素。總之,只要能區別輪廓線的內外就行。
T.再生數據輸出機構為了根據函數的係數再生圖象,例如利用能將再生圖象的尺寸從1mm的正方形到A3版指定的設計編輯器。可用有300DPI精度的雷射印表機或具有600DPI精度的雷射印表機印製再生圖象。此外,還可以用3000DPI的電植機(印刷機器)或400DPI的可讀數據對應的印表機、雷射剪輯機進行輸出。
用函數係數的形式存儲文字字體、詞符-插圖後,可以以任意的信率放大和縮小,另外,坐標也可任意指定其中心。因此,可以在任意的位置以任意的尺寸輸出任意的圖案、詞符-插圖。
上述機構,可以通過裝配含有根據用C語言編制的程序進行浮點運算的數值運算處理器的PC-9801DA來實現。
為確認本發明的效果,用本發明對鉛印體的「明」、「體」、黑體字的「語」以及JIS第1標準的文字進行了壓縮。其結果示於表2。另外,在圖40-圖42還示出了「明」、「體」、「語」3個文字的原圖象和根據本發明的再生圖象(用300DPI的雷射印表機進行列印)。從這些圖可知,能夠非常忠實地再生。
此外,還用本發明對圖43的樂譜音符、圖44的圓形圖表、圖45的香菸的詞符-插圖進行了壓縮,其結果於表3。並對這些樂譜音符、圓形圖表、香菸及圖50的半導體二極體等,分別在各圖的下半部示出了根據本發明的數據壓縮存儲後再生的圖象。它們都是優質的再生圖象,幾乎找不出與原圖象的區別。由此可知,根據本發明的再生圖象(用300DPI的雷射印表機進行列印)能夠不降低品質並且忠實地再生圖象。
表2、表3示出了用本發明把各文字、詞符-插圖數據壓縮後的數據量(字節)、壓縮率(%)和壓縮時間(秒)。
這裡,所謂壓縮率是用原圖象的數據量(約8k字節)去除按本發明所壓縮的字體的數據量(字節),再乘100,以%表示的數值、因為原圖象是用256×256象素的光學讀取裝置讀取的,所以有約8k字節的數據量,但是,用本發明的方法進行壓縮時,對於文字字體,將減少到300-500位元組,對於詞符-插圖將減少到100-300位元組的數據量。
壓縮率約為2-6%,可以歸結為極少量的數據。另外,每1個文字或1個詞符-插圖的壓縮時間約為數秒,時間極短。這裡所說的壓縮時間是CPU時間,也包括收入到單字的數據的分割合成處理時間和繪圖時間。
這樣,便可縮短處理時間,減少數據。特別是印刷體的文字,多數由直線部分構成,由於在第1階段作為已知的連接點抽出,故在第2階段進行反覆近似所求的連接點數就很少。
U.圖象存儲裝置2這是直接存儲再生文字字體、詞符-插圖的裝置。包括直接存儲用印表機列印出的文字的所有的機構裝置。也可以使用錄像機進行存儲。也包括列印的紙在內。也可以沒有特別的圖象存信儲置。
本發明讀取基本的文字字體、詞符-插圖後,可以壓縮為少量數據進行存儲。對於文字字體,每1個文字的處理時間很短。因而,即使創造由幾千字構成的漢字的新字體也能夠在短時間內把它們作為數據進行存儲。不僅存儲簡單,再生也很簡單。使用存儲數據能夠再生任意大小的文字。
另外,對於詞符-插圖,同樣也能以光學讀取詞符-插圖,並壓縮為少量數據進行存儲,沒有必要再以畫在紙上的原圖的形式進行保存。由於直線以直線形式抽出進行存儲,圓弧和圓以幾何學上的正確的圓弧和圓抽出進行存儲,所以,能夠除去包括在原圖象中和讀取時混入的噪聲,使畫質提高。此外,本發明能通過除去連接點,可以提高詞符-插圖的品質。並且,每1個詞符-插圖的處理時間很短。因而,即使創造眾多的新詞符-插圖也能在短時間內把它們作為數學的數據進行存儲。
不僅存儲簡單,而且再生也很簡單。使用存儲的數據,能在任意的位置再生任意大小的詞符-插圖。圖51和圖52是放大和縮小的例子。若用光學方法放大,則無論如何也增加噪聲,且輪廓線模糊不清。而本發明在計算的基礎上進行放大,所以直線作為直線進行再生,圓弧作為圓弧進行再生。自由曲線也一樣。由於這是在計算的基礎上進行放大,所以,線段不會凹凸不平,也不會模糊不清。
圖53和圖54示出圖形的放大、縮小、變形、迴轉、移動等是自由的。圖54中,(a)是沿縱方向拉伸,(b)是沿縱方向壓縮,(c)是沿斜方向拉伸,(d)是旋轉45度,(e)、(f)是縮小且旋轉的例子。圖55示出了同一標記的放大和縮小,並且位置也是任意的。這是自由曲線較多的例子,但是,這樣的圖形也能定義連接點,應用本發明。圖56、圖57示出了在明信片上印刷圖形的情況。能夠把原圖以任意的大小,印製到明信片的任意位置。考慮與文字的均衡分布,可以插入到適當的部位。不需要以前那種用剪刀剪下原圖,再用漿糊貼到原圖上的麻煩手續了。
以往,文字、詞符-插圖的放大、縮小並不容易,除了利用光學的方法進行放大和縮小外,沒有別的辦法。若把圖象進行光學放大、縮小、移動等過程後,會混入噪聲,降低品質。另外,不僅自由度低,而且費時間。反覆進行幾次複製後品質就降低得很顯著。
由於本發明是以連接點和分段多項式係數存儲數據的,所以,可以通過計算進行文字、詞符-插圖尺寸的放大、縮小、平行移動等等、因此,可以迅速、自由地進行文字、詞符-插圖的放大、縮小和移動等。通過這些操作,也不會使文字、詞符-插圖的品質惡化。本發明通過除去連接點還可以進一步提高文字字體、詞符-插圖的品質。
通過整體坐標的平行移動可以完成位置的移動。將作為基準的點的坐標、圓弧半徑、分段多項式的係數{Cxh}、{Cyh}乘以倍率,通過計算可以完成擴大和縮小。由於數據量少,所以計算可以迅速進行。
另外,圖54所示的旋轉也可以只通過計算完成。將作為基準的坐標和分段多項式的係數{Cxh}、{Cyh}乘以與迴轉角對應的係數,就可以求出新的係數。
通過計算,也可以給出圖54所示的沿不同方向的放大和縮小。這裡所謂不同的方向是放大和縮小的係數隨方向而不同。如同圓和橢圓,正方形和長方形之間的變換一樣。將x方向的係數{Cxh}和y方向的係數{Cyh}乘以不同的乘數後,只要進行前面所述的旋轉即可。
這樣,利用係數{Cxh}、{Cyh}的一次變換,就可以簡單地進行移動、旋轉、放大、縮小和不同方向的放大、縮小等的仿射變換。因為這些都是根據計算進行的。所以,不會因變形而摻入噪聲。另外,由於數據量少,所以,短時間的計算就可以完成。對於和由形狀所決定的文字不同的詞符-插圖的情況,這樣的變形常常是有用的。
在本發明中,圖形要素是以連接點和圓弧中心、半徑、自由曲線的係數等集合表現的,所以,上述計算量少,時間也短。而且,利用這樣的計算不會產生噪聲。即,通過這些操作,詞符-插圖的品質不會惡化。
表1根據本發明作成的數據結構內容大小(字節)連接點間是直線1.直線圖每個連接點間1時1.線分始點的坐標每個連接點間2連接點間是圓弧1.圓弧圖每個連接點間1時1.圓弧始點坐標每個連接點間21.各連接點間的函數中每個連接點間4心角的係數narc(1/4≤narc≤1)1.存在於各連接點間的每個連接點間11個節點區間中的輪廓點數1.近似函數的係數(6 每個連接點間12個)連接點間是自由1.各連接點間的函數因每個連接點間1曲線時次數M(M≥3)1.存在於各連接點間的每個連接點間11個節點區間中的輪廓點數1.在各連接點間的輪廓每個連接點間2點列的變動中心(μx,μy)1.近似函數的係數每個連接點間2MCX、Cy
表2用本發明的數據平均量、壓縮率、壓縮時間(文字字體數據)
表3用本發明的平均數據量、壓縮率、壓縮時間(標識、圖符)
權利要求
1.一種文字數據輸入輸出裝置,其特徵在於包括文字讀取裝置,用於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應並進行存儲;輪廓線抽取機構,用於抽取與從橫排列象素對應的已讀取的文字的輪廓線;輪廓點串存儲機構,用於對每個連續的群,把抽取出的輪廓線的2維坐標(X,Y)進行存儲;數據近似機構A,其用途是,設自變量為t,因變量為x、y,使用以t為自變量,x、y為因變量的2次分段多項式近似上述各群中輪廓點串的x、y坐標,反覆進行最小二乘法近似直到近似精度達到指定的範圍,並求出各輪廓點串群的近似多項式;曲率運算機構,用於根據上述近似結果,求出在x、y空間中各群的點串的每一點的曲率;正圓抽取機構;用於根據各群的曲率數據抽取正圓;臨時連接點位置抽取機構,用於根據點串的曲率數據抽取空間不可微點作為臨時連接點;最佳連接點抽取機構,用於把位於臨時連接點近旁的其它候補連接點根據相關關係概率地實施曲線擬合,求出最佳連接點;不必要的連接點除去機構,用於從最佳連接點中找出並除去那些即使去掉去也可以保證近似精度的不必要連接點;數據近似機構B,其用途是當按直線、圓弧的順序近似同一點串群內的相鄰連接點之間不能得到指定的精度時,就用以t為自變量,x、y為因變量的2次分段多項式進行近似,並在增加2次分段多項式因次數的同時,反覆時行最小二乘近似,直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線。壓縮數據存儲機構,用於對每個點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似每個點串群的連接點的坐標和相鄰連接點函數的參數,再生出輪廓線;文字再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的文字字體作為文字輸出。
2.一種文字數據輸入輸出裝置,其特徵在於包括文字讀取裝置,用於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應,並進行存儲;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的文字的輪廓線;輪廓點串存儲機構,用於對每個連續的群把抽取出的輪廓線的2維坐標(x、y)進行存儲;數據近似機構,用於用以t為自變量,x、y為因變量的2次分段多項式近似上述各群的輪廓點串的x、y坐標,反覆進行最小二乘法近似直到近似精度達到指定的範圍,並求出各輪廓點串群的近似多項式;曲率運算機構,用於根據上述近似結果,求出在x、y空間的各群內點串的每一點的曲率;正圓抽取機構,用於根據各群的曲率數據抽取出正圓;臨時連接點位置抽取機構,用於根據點串的曲率數據抽取出空間不可微點作為臨時連接點;最佳連接點抽取機構,用於把位於臨時連接點近旁的其它候補連接點根據相關關係概率地實施曲線擬合,求出最佳連接點;數據近似機構,用於當按直線、圓弧的順次近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,x、y為因變量的2次分段多項式進行近似,並在增加2次分段多項式的因次的同時,反覆進行最小二乘近似直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;壓縮數據存儲機構,用於對每個點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似每個點串群的連接點的坐標和相鄰連接點的函數的參數,並再行出輪廓線;文字再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的文字字體作為文字輸出。
3.一種文字數據輸入輸出裝置,其特徵在於包括文字讀取裝置,用於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應並進行存儲;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的文字的輪廓線;輪廓點串存儲機構,用於對每個連續的群把抽取出的輪廓線的2維坐標(x、y)進行存儲;數據近似機構,用於用以t為自變量,x、y為因變量的分段多項式近似上述各群的輪廓線點串的x、y坐標,求出各輪廓線點串的近似多項式;曲率運算機構,用於根據上述近似結果,求出在x、y空間的各群的點串的每一點的曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;連接點位置抽取機構,用於根據點串的曲率數據抽取出空間不可微點作為連接點;數據近似機構,用於當按直線、圓弧的順序近似同一點串群內的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,x、y為因變量的分段多項式進行近似,從而利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;壓縮數據存儲機構,用於對每個點串群存儲近似上述連接點坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各輪廓點串群的連接點的坐標和相鄰連接點的函數的參數,並再生出輪廓線;文字再生機構,用於使再生輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的文字字體作為文字輸出。
4.一種文字數據輸入輸出裝置,其特徵在於包括文字讀取裝置,用於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應並進行存儲;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的文字的輪廓線;輪廓點串存儲機構,用於對每個連續的群把抽取出的輪廓線的2維坐標(X、Y)以t為自變量,X,Y為因變量進行存儲;曲率運算機構,用於求出x、y空間的各群內點串的每一點的離散曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;連接點位置抽取機構,用於根據點串的曲率數據抽出空間不可策點作為連接點;數據近似機構,用於當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆進行最小二乘近似,直到近似精度達到指定的數值,再利用直線、圓弧、分段多項式近似相鄰連接之間的連線;壓縮數據存儲機構,用於對每個點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各點串群的連接點的坐標和相鄰連接點的函數的參數,並再生出輪廓線;文字再生機構,用於使再生的輪廓線內的象素和外部的象素對應不同的值;再生數據輸出機構,用於把再生的文字字體作為文字輸出。
5.一種文字數據的輸入輸出方法,其特徵在於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應,並存儲這些數據;抽取出與縱橫排列象素對應的已讀取的文字的輪廓線,對每個連續的群,以t為自變量,以X、Y為因變量存儲已抽取出的輪廓線的2維坐標(X,Y);設自變量為t,因變量為x,y,用以t為自變量,x、y為因變量的分段多項式近似上述各群的輪廓點串的x、y坐標;根據上述近似結果;求x、y空間的各群中點串的每一點的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取出空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群內的相鄰連接點之間不能得到指定的近似精度時,用以t為自變量,x、y為因變量的分段多項式近似;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入文字字體數據;而在輸出文字時對各點串群輸出存儲的近似連接點坐標和相鄰連接點之間的函數的參數;然後再生文字字體的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的值,再生出文字,最後把再生的文字字體作為文字輸出。
6.一種文字數據輸入輸出方法,其特徵在於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;抽取與縱橫排列象素對應的已讀取的文字的輪廓線;對各連續群以t為自變量,X、Y為因變量存儲已抽取的輪廓線的2維坐標(X,Y);設自變量為t,因變量作為x、y,用以t為自變量,x、y為因變量的分段多項式近似上述各群的輪廓線點串的x、y坐標;根據上述近似結果,求出x、y空間的各群中點串的每一點的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取出空間不可微點作為臨時連接點;把位於臨時連接點近旁的其它候補連接點根據相關關係概率地進行曲線擬合,求出最適宜的連接點;從最佳連接點中找出並除去即使沒有也能保證近似精度的不必要的連接點;當按直線、圓弧的順序近似同一點串群內相鄰連接點之間不能得到指定的近似精度時,用以t為自變量、x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆用最小二乘近似直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入文字字體數據;另一方面,輸出文字時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數;然後再生文字字體的輪廓線;通過使再生的輪廓線內的象素和外部的象素對應不同的值,再生出文字;最後把再生的文字字體作為文字輸出。
7.一種文字數據輸入輸出方法,其特徵在於光學讀取文字字體數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;抽取與縱橫排列象素對應的已讀取的文字的輪廓線;對各連續群以t為自變量,X、Y為因變量存儲已抽出的輪廓線的2維坐標(X、Y);求出x、y空間各群的點串的每一點的離散的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆進行最小二乘近似,直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入文字字體數據;另一方面,輸出文字時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數;然後再生文字字體的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的數值,再生出文字;最後把再生的文字字體作為文字輸出。
8.一種詞符-插圖數據輸入輸出裝置,其特徵在於包括詞符-插圖讀取裝置,用於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並進行應存儲;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;輪廓點串存儲機構,用於對每個連續的群把抽取出的輪廓線的2維坐標(X,Y)進行存儲;數據近似機構A,用於用以t為自變量,x、y為因變量的2次分段多項式近似上述各群輪廓線點串的x、y坐標,反覆進行最小二乘近似直到近似精度達到指定的範圍,並求出各輪廓點串群的近似多項式;曲率運算機構,用於根據上述近似結構求出x、y空間各群的點串的每一點的曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;臨時連接點位置抽取機構,用於根據點串的曲率數據抽取空間不可微點作為臨時連接點;最佳連接點抽取機構,用於把位於臨時連接點近旁的其它候補連接點根據相關關係概率地進行曲線擬合,求出最佳連接點;不必要的連接點除去機構,用於從最佳連接點中找出並除去即使沒有也能保證近似精度的不必要的連接點;數據近似機構B,用於當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,x、y為因變量的2次分段多項式進行近似,並在增加2次分段多項式的因次數的同時,反覆進行最小二乘近似直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;壓縮數據存儲機構,用於對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各點串群的連接點的坐標和相鄰連接點之間的函數的參數,並再生出輪廓線;詞符-插圖再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的詞符-插圖作為詞符-插圖輸出。
9.一種詞符-插圖輸入輸出裝置,其特徵在於包括詞符-插圖讀取裝置,用於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;輪廓點串存儲機構,用於存儲對每個把抽取出的輪廓線的2維坐標(X、Y)連續起來的群;數據近似機構,用於用以t為自變量,以x、y為因變量的分段多項式近似上述各群的輪廓線點串的x、y坐標,反覆進行最小2乘近似直到近似精度達到指定的範圍,並求出各輪廓點串群的近似多項式;曲率運算機構,用於根據上述近似結果,求出x、y空間各群的點串的每一點的曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;臨時連接點位置抽取機構,用於根據點串的曲率數據抽取空間不可微點作為臨時連接點;最佳連接點抽取機構,用於把位於臨時連接點近旁的其它候補連接點,根據相關關係概率地進行曲線擬合,求出最佳連接點;數據近似機構,用於當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加2次分段多項式的因次數的同時反覆進行最小二乘近似直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;壓縮數據存儲機構,用於對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各點串群的連接點的坐標和相鄰連接點的函數的參數,並再生出輪廓線;詞符-插圖再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的詞符-插圖作為詞符-插圖輸出。
10.一種詞符-插圖輸入輸出裝置,其特徵在於包括詞符-插圖讀取裝置,用於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;輪廓線抽取機構,用於抽取與縱橫排列的象素對應的已讀取的詞符-插圖的輪廓線;輪廓點串存儲機構,用於存儲對每個把抽取出的輪廓線的2維坐標(X、Y)連續起來的群;數據近似機構,用於用以t為自變量,以x、y為因變量的分段多項式近似上述各群的輪廓線點串的x、y坐標,求出各輪廓線點串群的近似多項式;曲率運算機構,用於根據上述近似結果,求出x、y空間各群的點串的每一點的曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;連接點位置抽出機構,用於根據點串的曲率數據抽取空間不可微點作為連接點;數據近似機構,用於用直線、圓弧、分段多項式近似相鄰連接點間,當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,x、y為因變量的分段多項式進行近似;然後,再利用直線、圓弧、分段多項式近似相鄰連接點之間;壓縮數據存儲機構,用於對各點串群存儲近似上述連接點的坐標和相鄰連接點的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各點串群的連接點的坐標和相鄰連接點的函數的參數,並再生出輪廓線;詞符-插圖再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的詞符-插圖作為詞符-插圖輸出。
11.一種詞符-插圖輸入輸出裝置,其特徵在於包括詞符-插圖讀取裝置,用於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;輪廓線抽取機構,用於抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;輪廓點串存儲機構,用於以t為自變量,以X,Y為因變量存儲對每個把抽取出的輪廓線的2維坐標(X,Y)連續起來的群;曲率運算機構,用於求出x、y空間各群的點串的每一點的離散曲率;正圓抽取機構,用於根據各群的曲率數據抽取正圓;連接點位置抽取機構,用於根據點串的曲率數據抽取空間不可微點作為連接點;數據近似機構,用於當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆進行最小二乘近似,直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點;壓縮數據存儲機構,用於對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數;輪廓再生機構,用於輸入存儲的壓縮數據,得到近似各點串群的連接點的坐標和相鄰連接點的函數的參數,並再生出輪廓線;詞符-插圖再生機構,用於使再生的輪廓線內的象素和外部象素對應不同的值;再生數據輸出機構,用於把再生的詞符-插圖作為調符-插圖輸出。
12.一種詞符-插圖數據輸入輸出方法,其特徵在於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線,以t為自變量,以X、Y為因變量存儲對每個把抽取出的輪廓線的2維坐標(X,Y)連續起來的群;設自變量為t,把因變量為x、y,用以t為自變量,以x、y為因變量的分段多項式近似上述各輪廓點串的X、Y坐標;根據上述近似結果,求出x、y空間各群的點串的每一點的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時用以t為自變量,以x、y為因變量的分段多項式進行近似;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入詞符-插圖;另一方面,輸出詞符-插圖時,對各點串群輸出存儲的連接點的坐標和相鄰連接點之間的函數的參數,然後再生詞符-插圖的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的值,再生出詞符-插圖;最後把再生的詞符-插圖作為詞符-插圖輸出。
13.一種詞符-插圖數據輸入輸出方法,其特徵在於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應,並存儲這些數據;抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;以t為自變量,以X、Y為因變量存儲對每個把抽取出的輪廓線的2維坐標(X、Y)連續起來的群;設自變量為t,把因變量為x、y,用以t為自變量,x、Y為因變量的分段多項式近似上述各群的輪廓線點串的X、Y坐標;根據上述近似結果,求出x、y空間各群的點串的每一點的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取空間不可微點作為臨時連接點;把位於臨時連接點近旁的其它候補連接點根據相關關係曲線概率地進行曲線擬合,求出最佳連接點;從最佳連接點中找出並除去即使沒有也能保證近似精度的不必要的連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的近似精度時,就用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆進行最小二乘近似直到近似精度達到指定的數值後,再利用直線、圓弧、分段多項式近似相鄰連接點之間的連線;通過對各點串群存儲上述近似連接點的坐標和相鄰連接點的函數的參數,輸入詞符-插圖;另一方面,輸出詞符-插圖時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數;然後再生詞符-插圖的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的值,再生出詞符-插圖,最後,把再生的詞符-插圖作為詞符-插圖輸出。
14.一種詞符-插圖的輸入輸出方法,其特徵在於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;以t為自變量,以X、Y為因變量存儲對每個把抽取出的輪廓線的2維坐標(X、Y)連續起來的群;求出x、y空間各群的點串的每一點的離散曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取出空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接之間不能得到指定的近似精度時,就用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,反覆進行最小二乘近似直到近似精度達到指定的數值後,再用直線、圓弧、分段多項式近似相鄰連接點之間;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點的函數的參數,輸入詞符-插圖;另一方面,輸出詞符-插圖時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數;然後再生詞符-插圖的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的值,再生出詞符-插圖;最後把再生的詞符-插圖作為詞符-插圖再生。
15.一種詞符-插圖數據的輸入輸出方法,其特徵在於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應並存儲這些數據;抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;以t為自變量,X、Y為因變量存儲對每個把抽取出的輪廓線的2維坐標(X、Y)連續起來的群;設自變量為t,因變量為x、y,用以t為自變量t、x、y為因變量的分段多項式近似上述各群的輪廓點串的X、Y坐標;根據上述近似結果,求出x、y空間各群的點串的每一點的曲率;根據各群的曲率數據抽取正圓;根據點串的曲率數據抽取空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的精度時,用以t為自變量,以x、y因變量的分段多項式進行近似;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入詞符-插圖;另一方面,輸出詞符-插圖時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數;平移這些連接點的坐標,或者將連接點的坐標和圓弧的曲率、分段多項式的係數等乘以x方向,y方向的係數,通過求和進行平移、放大縮小、旋轉及不同方向的放大縮小等等之後,再生詞符-插圖的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不不的值,再生出詞符-插圖,最後,把再生的詞符-插圖作為詞符-插圖輸出。
16.一種詞符-插圖數據輸入輸出方法,其特徵在於光學讀取詞符-插圖數據,使這些數據與有限個縱橫排列的象素對應;抽取與縱橫排列象素對應的已讀取的詞符-插圖的輪廓線;以t為自變量,以X、Y為因變量存儲對每個把已抽取出的輪廓線的2維坐標(X、Y)連續起來的群;求出x、y空間各群的點串的每一點的離散曲率;根據各群的曲率數據抽取正圓,根據點串的曲率數據抽取空間不可微點作為連接點;當按直線、圓弧的順序近似同一點串群的相鄰連接點之間不能得到指定的精度時,就用以t為自變量,以x、y為因變量的分段多項式進行近似,並在增加分段多項式的因次數的同時,進行最小二乘近似直到近似精度達到指定的數值後,再用直線、圓弧、分段多項式近似相鄰連接點之間的連線;通過對各點串群存儲近似上述連接點的坐標和相鄰連接點之間的函數的參數,輸入詞符-插圖數據;另一方面,輸出詞符-插圖時,對各點串群輸出存儲的近似連接點的坐標和相鄰連接點之間的函數的參數,平移這些連接點的坐標或將連接點的坐標和圓弧的曲率,分段多項式的係數等乘以x方向、y方向的係數,通過求和,進行平移、放大縮小、旋轉、不同方向的放大縮小等某種操作之後,再生詞符-插圖的輪廓線;通過使再生的輪廓線內的象素和外部象素對應不同的值,再生出詞符-插圖,最後,把再生的詞符-插圖作為詞符-插圖輸出。
全文摘要
本發明能用很短時間把文字字體、詞符一插圖變換為少量數據進行存儲,並能以任意尺寸、在任意的位置再生。其構成是以光學讀取文字字體、詞符一插圖,求輪廓點串,利用自變量t存儲輪廓點串的坐標,求輪廓點串的連接點,利用直線、圓弧、自由曲線近似連接點之間的區間,存儲近似的參數的連接點坐標。輸出聯結連接點的坐標和相鄰連接點的線段的參數,由此再生輪廓點串,將輪廓點串所圍區域同其它區域進行區別後,再生文字、詞符—插圖。
文檔編號G06T9/20GK1083954SQ9311707
公開日1994年3月16日 申請日期1993年8月30日 優先權日1992年9月1日
發明者寅市和男 申請人:寅市和男