漢字筆畫造字法的製作方法
2023-06-17 09:16:41 2
專利名稱:漢字筆畫造字法的製作方法
本說明書介紹一種以「形旁和聲旁組成形聲字」的造字規律,運用全信息計算機漢字表達式知識庫以及「遞歸定義算法」,在計算機一維平面上自動生成各式各樣漢字字形的計算機自動造字法--同舟自動造字法。
一、文字的產生和漢字演變的簡單過程文字是人們用於表達思想的一種有規律性的、系統化的符號。說話是用聲音來描述這種符號,是以音達意。寫字是用象形來描述這種符號,是以形達意。為了便於人們記憶這些可以表達各種不同思維活動的符號,遵循著兩條不同的軌道,就形成了兩大類文字系統--拼音文字系統和象形文字系統。由於拼音文字是按照發音的先後次序,在一維空間建立了一個線性序,並將各種不同頻率的聲音,用少量的可區別符號記錄下來,便有了以形代音的拼音文字。這些記錄發音的可區別符號稱之為字母。如英文字母就是26個。因此,拼音文字的優點是用很少量的字母,排成一維的序,便可產生無限多個表達不同思維活動的文字。而且見形即可發音,以音達意。由於拼音文字「形音結合」的直接性,所以能做到字話一律,見字即能念,會說即能寫,有多少個詞就有多少個字,發展至今已有幾十萬個單詞。
象形文字不但注重形音結合,更注意形意結合。它不但在一維空間建立了一個用音描述文字符號的序,還在二維平面建立了一個用形描述文字符號的序,不但做到見形發音,而且還可以直接見形知音。而且從形到意是有規律可循的。我國漢代著名文學家許慎在「說文解字」一書中寫道「倉頡之初作書,蓋依類象形,故謂之文。其後形聲相益,即謂之字。字者,言孳乳而浸多也。」如許慎所言,倉頡造字是先有象形的文。文者,花紋也,與圖案相似。隨著天地萬物本身的曲線形態來構造,在甲骨文、金文時代還無特定的結構,象什麼是什麼罷了。秦相李斯統一六國文字後,創造了秦篆,簡化曲線圖案,形成了有規律的筆畫,但仍保留了象形文字的結構。而且形聲相益,由象形的文孳乳繁衍出形聲字。以後,由篆到隸,由隸到楷,象形的漢字結構沒有變,筆畫卻形成了平直方正的有規律的系統,文字也就演變成為越來越利於書寫的象形文字了,並長期處於「形聲字」長期穩定的階段。這就是我國漢字發展、演變的大致過程。
二、目前我國造字的現狀以及計算機造字的缺陷。
現行的計算機造字方法,大都採用字型專家設計的字體和字型,通過專家把每個字畫在紙上,用數位化儀或掃描儀把一個個畫在紙上的字掃描輸入到計算機進行數位化處理而變為點陣漢字(也稱Bitmap,用無數個點來描述漢字筆劃)。通過計算機軟體和程序,把這些點陣漢字轉變為輪廓字,用計算機軟體把這些輪廓字一個個調出來,在計算機屏幕上用人工進行逐個修整,去掉多餘的點,保證直線段和曲線段的平滑過渡,得到合格的、質量好的輪廓字,然後,把經過修整過的輪廓字,用程序轉變為POSTSCRIPT或者TRUE TYPE數據格式的字,最後經過排序而得到字庫。儘管用計算機來處理,但整個過程仍需要大量的人工幹預,生成一套國標GB-2312字庫字形,要花費一人一年的時間。
三、同舟造字法的原理同舟造字法遵循形聲字是由「形旁」和「聲旁」組成形聲字的結構規律和所有漢字是由五種基本筆劃(即橫「一」、豎「丨」、撇「丿」、捺「」、點「丶」組成漢字的二個構字基本規律為原理,採用「遞歸定義算法」,借用全信息漢字表達式知識庫和創建新漢字的全信息表達式知識庫的形式而完成無限個漢字的造字過程,它是未來計算機造字的方向。要完成自動生成無限個漢字的造字過程,必須具備如下幾個條件一是具備「以用很少量的字母,排成一維的序,便可產生無限多個表達不同思維活動的文字」這一條件。大家知道,英文字母的數量只有26個,而電腦又是在英文的條件下發明的,它之所以具有無限的擴展性,就是因為它的組字元素少,內外碼相同,交換容易,輸入時,不需代碼,直接輸入英文字母,在一維平面組合單詞簡單快捷。
我們在漢字中提取了52個中文字母字,具有與52個英文大小字母的組字特性和功能,並且理順了長期以來一直被人們顛倒了的中英文字素的正確關係,即英文單詞本來與中文的字詞相對應,英文的字母本應是與中文的字部件或組合筆畫對應關係,但長期以來卻一直被中文計算機的設計者們顛倒為中文的字與英文的字母、中文的詞與英文的單詞等同。大量的數據表明,我們所提取的52個中文字母字(35個形旁、5種單筆劃和12種複合筆劃構成)完全可以組合所有的漢字,並且運用這52個中文字母可以造出無限個漢字。這52個中文字母字分別是目、人、 十、蟲、訁、廣、食、 月、 白、酉、山、禾、石、口、 釒、車、革、門、馬、屍;日、亻、 犭、 亠 、二、冂、衤、、丶、一、丨、丿、宀、 扌、艹、 二是具備全信息漢字表達式。(詳見分項發明專利「全信息漢字表達式的實現方法」)全信息漢字數學表達式如下F=∑fi{T1(a、b、c)、T2(a、b、c)……Tn(a、b、c)}i=1-∽n≤256F定義為漢字的集合,集合的數量由i定義,可以是無限的。
Tn表示中文字母字元素。n≤256表示組成漢字的中文字母字元素小於256。在實際應用中,n=52a表示中文字母字所處結點的結構信息b表示中文字母字的定位信息c表示中文字母字尺寸信息下面是52個中文字母字組成漢字的實際表達式。在得到實際表達式之前,我們定義如下參數預設值表示中文字母字;1表示漢字的左右結構;2表示漢字的上下結構;3表示漢字的左中右結構;4表示漢字的上中下結構;5表示漢字的獨體結構;6漢字的遞歸定義符,它表示該漢字的全信息漢字表達式採用遞歸調用方法;a(x,y)表示中文字母字的尺寸參數;b(x,y)表示中文字母字的位移參數;以「覆」字為代表的漢字在實際應用中的全信息漢字表達式覆=2[5一冂丿乚一1(2 亻3( 日5 按照「遞歸定義算法」,漢字「覆」的全信息漢字表達式就變為如下表達式覆=2[6西6復]西=5一冂丿乚一復=1[6彳6復]復=3[ 日6夂]夂=5 三是必須具有中文自身的信息交換標準代碼。
由於52個中文字母的全信息漢字表達式的出現,制定一個基於中文的計算機信息交換碼標準,我們稱它為中文字母字信息交換碼,英文縮寫為CACII(Chinese Alphabet Code for Information Interchange)。一個最簡單的方法是用52個中文字母字和中文標點符點,替換ASCII代碼的52個大小寫英文字母和英文標點符點而成為CACII代碼。
四是中文字母字組字技術。(詳見分項發明專利「中文字母字組字技術」申請號99114284.5)四、「同舟自動造字法」的實現藉助上面四項技術,「同舟自動造字法」就變為非常簡單,只要用遞歸算法來定義你要造的字,計算機根據遞歸定義和調用全息漢字表達式,就能造出你要的漢字。
下面是國標(GB-2312)16區的94個漢字的遞歸定義的全信息漢字表達式,計算機根據定義就可以自動造出這94個宋體漢字。 「同舟自動造字法」所造的漢字數目是無限的,所造的字體字型風格也是無限的。下面舉兩個例子如果我們新增加的漢字在全信息漢字表達式知識庫裡找不到該字的定義,可增加新的全漢信息漢字表達式給知識庫。舉例如下「綗」是我們需要新增加的一個左右型漢字,但在知識庫裡並沒有右邊部件字 的全漢信息漢字表達式定義,所以需要增加新的定義如下: 計算機根據這些新的定義自動生成這個字。同時也可以用所定義的 字與所有形旁組成一系列新字。
五、創造新的全信息漢字表達式知識庫用傳統的造字方法生產一套漢字字庫是一件相當費工費時的繁重任務。一套6763個漢字字庫的製作要花掉一人一年的時間。藉助全信息漢字表達式和遞歸定義算法,僅僅只要精心製作52個中文字母字庫和調整修正尺寸參數庫和移位參數庫,創造新的全信息漢字表達式知識庫,藉助這些技術,製作一套6763個漢字大概一人半個月的時間即可完成。通過改變52個中文字母字的型狀和風格,很容易產生系列新字體。也可以無限擴大字數,由6763個漢字變為沒有數目限制的無限漢字字符集。
我們用「全信息漢字表達式知識庫」這個提法是因為計算機藉助知識庫的內容能夠理解漢字的結構和組成,並能寫出這個漢字,計算機具有寫漢字造漢字的的智能。計算機全信息漢字表達式知識庫應包括下面幾個內容(1)漢字獨體字和音旁字的全信息漢字表達式;(2)沒有收入到52個中文字母字的形旁字的全信息漢字表達式;(3)部份特殊複合字的遞歸定義式;(4)形旁字與聲旁字互相拼字的寬度表。
該同舟自動造字法將廣泛用於漢字的輸入、輸出設備。真正做到和實現了計算機自動造漢字。大大提高漢字字庫的生產效率。
說明書附面說明該圖是以「遞歸定義算法」和「全信息漢字表達式」顯示中文字母字組成漢字(以「啊」字為例)遞歸組字示意圖。以此種方法可以造出無窮盡個漢字,與英文字母造詞一樣簡單和容易。
權利要求
1. 不得將「同舟自動造字法」的中文字母字組字技術、形聲字的形旁字、聲旁字的遞歸定義造字原理、全信息漢字表達式知識庫等技術應用於非F系統的任何品牌的計算機製作任何造字軟體;
2. 不得將以上技術應用到非鍵盤輸入設備作為漢字輸入和造字軟體,或製成其他輸入法輸入和傳輸文字信息等。
3. 不得以上述技術配套其它品牌的計算機冒充尖端單字節漢字電腦。
全文摘要
本造字法以形聲字的造字規律,運用全信息漢字表達式知識庫和遞歸定義算法,在計算機一維平面自動生成漢字各種字體和字型。由於採用52個字母字組拼漢字,具有英文字母組單詞的無限擴充性,所造漢字內碼具有唯一性,故可造出無限個不同風格的漢字,而且在F系統規範下的計算機都可以讀出和列印出這些漢字。該造字法廣泛應用於漢字輸入、輸出設備等,實現了計算機自動造字的夙願,將大大提高漢字字庫的生成技術和效率。
文檔編號G06F17/00GK1294357SQ9911450
公開日2001年5月9日 申請日期1999年10月21日 優先權日1999年10月21日
發明者吳昌森, 周海籌, 唐秀昌, 鄭承梁, 何慶, 張彥紅 申請人:張彥紅