新四季網

漢字筆畫造字法的製作方法

2023-06-17 09:16:41 1

專利名稱:漢字筆畫造字法的製作方法
本說明書介紹一種以「形旁和聲旁組成形聲字」的造字規律,運用全信息計算機漢字表達式知識庫以及「遞歸定義算法」,在計算機一維平面上自動生成各式各樣漢字字形的計算機自動造字法--同舟自動造字法。
一、文字的產生和漢字演變的簡單過程文字是人們用於表達思想的一種有規律性的、系統化的符號。說話是用聲音來描述這種符號,是以音達意。寫字是用象形來描述這種符號,是以形達意。為了便於人們記憶這些可以表達各種不同思維活動的符號,遵循著兩條不同的軌道,就形成了兩大類文字系統--拼音文字系統和象形文字系統。由於拼音文字是按照發音的先後次序,在一維空間建立了一個線性序,並將各種不同頻率的聲音,用少量的可區別符號記錄下來,便有了以形代音的拼音文字。這些記錄發音的可區別符號稱之為字母。如英文字母就是26個。因此,拼音文字的優點是用很少量的字母,排成一維的序,便可產生無限多個表達不同思維活動的文字。而且見形即可發音,以音達意。由於拼音文字「形音結合」的直接性,所以能做到字話一律,見字即能念,會說即能寫,有多少個詞就有多少個字,發展至今已有幾十萬個單詞。
象形文字不但注重形音結合,更注意形意結合。它不但在一維空間建立了一個用音描述文字符號的序,還在二維平面建立了一個用形描述文字符號的序,不但做到見形發音,而且還可以直接見形知音。而且從形到意是有規律可循的。我國漢代著名文學家許慎在「說文解字」一書中寫道「倉頡之初作書,蓋依類象形,故謂之文。其後形聲相益,即謂之字。字者,言孳乳而浸多也。」如許慎所言,倉頡造字是先有象形的文。文者,花紋也,與圖案相似。隨著天地萬物本身的曲線形態來構造,在甲骨文、金文時代還無特定的結構,象什麼是什麼罷了。秦相李斯統一六國文字後,創造了秦篆,簡化曲線圖案,形成了有規律的筆畫,但仍保留了象形文字的結構。而且形聲相益,由象形的文孳乳繁衍出形聲字。以後,由篆到隸,由隸到楷,象形的漢字結構沒有變,筆畫卻形成了平直方正的有規律的系統,文字也就演變成為越來越利於書寫的象形文字了,並長期處於「形聲字」長期穩定的階段。這就是我國漢字發展、演變的大致過程。
二、目前我國造字的現狀以及計算機造字的缺陷。
現行的計算機造字方法,大都採用字型專家設計的字體和字型,通過專家把每個字畫在紙上,用數位化儀或掃描儀把一個個畫在紙上的字掃描輸入到計算機進行數位化處理而變為點陣漢字(也稱Bitmap,用無數個點來描述漢字筆劃)。通過計算機軟體和程序,把這些點陣漢字轉變為輪廓字,用計算機軟體把這些輪廓字一個個調出來,在計算機屏幕上用人工進行逐個修整,去掉多餘的點,保證直線段和曲線段的平滑過渡,得到合格的、質量好的輪廓字,然後,把經過修整過的輪廓字,用程序轉變為POSTSCRIPT或者TRUE TYPE數據格式的字,最後經過排序而得到字庫。儘管用計算機來處理,但整個過程仍需要大量的人工幹預,生成一套國標GB-2312字庫字形,要花費一人一年的時間。
三、同舟造字法的原理同舟造字法遵循形聲字是由「形旁」和「聲旁」組成形聲字的結構規律和所有漢字是由五種基本筆劃(即橫「一」、豎「丨」、撇「丿」、捺「」、點「丶」組成漢字的二個構字基本規律為原理,採用「遞歸定義算法」,借用全信息漢字表達式知識庫和創建新漢字的全信息表達式知識庫的形式而完成無限個漢字的造字過程,它是未來計算機造字的方向。要完成自動生成無限個漢字的造字過程,必須具備如下幾個條件一是具備「以用很少量的字母,排成一維的序,便可產生無限多個表達不同思維活動的文字」這一條件。大家知道,英文字母的數量只有26個,而電腦又是在英文的條件下發明的,它之所以具有無限的擴展性,就是因為它的組字元素少,內外碼相同,交換容易,輸入時,不需代碼,直接輸入英文字母,在一維平面組合單詞簡單快捷。
我們在漢字中提取了52個中文字母字,具有與52個英文大小字母的組字特性和功能,並且理順了長期以來一直被人們顛倒了的中英文字素的正確關係,即英文單詞本來與中文的字詞相對應,英文的字母本應是與中文的字部件或組合筆畫對應關係,但長期以來卻一直被中文計算機的設計者們顛倒為中文的字與英文的字母、中文的詞與英文的單詞等同。大量的數據表明,我們所提取的52個中文字母字(35個形旁、5種單筆劃和12種複合筆劃構成)完全可以組合所有的漢字,並且運用這52個中文字母可以造出無限個漢字。這52個中文字母字分別是目、人、 十、蟲、訁、廣、食、 月、 白、酉、山、禾、石、口、 釒、車、革、門、馬、屍;日、亻、 犭、 亠 、二、冂、衤、、丶、一、丨、丿、宀、 扌、艹、 二是具備全信息漢字表達式。(詳見分項發明專利「全信息漢字表達式的實現方法」)全信息漢字數學表達式如下F=∑fi{T1(a、b、c)、T2(a、b、c)……Tn(a、b、c)}i=1-∽n≤256F定義為漢字的集合,集合的數量由i定義,可以是無限的。
Tn表示中文字母字元素。n≤256表示組成漢字的中文字母字元素小於256。在實際應用中,n=52a表示中文字母字所處結點的結構信息b表示中文字母字的定位信息c表示中文字母字尺寸信息下面是52個中文字母字組成漢字的實際表達式。在得到實際表達式之前,我們定義如下參數預設值表示中文字母字;1表示漢字的左右結構;2表示漢字的上下結構;3表示漢字的左中右結構;4表示漢字的上中下結構;5表示漢字的獨體結構;6漢字的遞歸定義符,它表示該漢字的全信息漢字表達式採用遞歸調用方法;a(x,y)表示中文字母字的尺寸參數;b(x,y)表示中文字母字的位移參數;以「覆」字為代表的漢字在實際應用中的全信息漢字表達式覆=2[5一冂丿乚一1(2 亻3( 日5 按照「遞歸定義算法」,漢字「覆」的全信息漢字表達式就變為如下表達式覆=2[6西6復]西=5一冂丿乚一復=1[6彳6復]復=3[ 日6夂]夂=5 三是必須具有中文自身的信息交換標準代碼。
由於52個中文字母的全信息漢字表達式的出現,制定一個基於中文的計算機信息交換碼標準,我們稱它為中文字母字信息交換碼,英文縮寫為CACII(Chinese Alphabet Code for Information Interchange)。一個最簡單的方法是用52個中文字母字和中文標點符點,替換ASCII代碼的52個大小寫英文字母和英文標點符點而成為CACII代碼。
四是中文字母字組字技術。(詳見分項發明專利「中文字母字組字技術」申請號99114284.5)四、「同舟自動造字法」的實現藉助上面四項技術,「同舟自動造字法」就變為非常簡單,只要用遞歸算法來定義你要造的字,計算機根據遞歸定義和調用全息漢字表達式,就能造出你要的漢字。
下面是國標(GB-2312)16區的94個漢字的遞歸定義的全信息漢字表達式,計算機根據定義就可以自動造出這94個宋體漢字。 「同舟自動造字法」所造的漢字數目是無限的,所造的字體字型風格也是無限的。下面舉兩個例子如果我們新增加的漢字在全信息漢字表達式知識庫裡找不到該字的定義,可增加新的全漢信息漢字表達式給知識庫。舉例如下「綗」是我們需要新增加的一個左右型漢字,但在知識庫裡並沒有右邊部件字 的全漢信息漢字表達式定義,所以需要增加新的定義如下: 計算機根據這些新的定義自動生成這個字。同時也可以用所定義的 字與所有形旁組成一系列新字。
五、創造新的全信息漢字表達式知識庫用傳統的造字方法生產一套漢字字庫是一件相當費工費時的繁重任務。一套6763個漢字字庫的製作要花掉一人一年的時間。藉助全信息漢字表達式和遞歸定義算法,僅僅只要精心製作52個中文字母字庫和調整修正尺寸參數庫和移位參數庫,創造新的全信息漢字表達式知識庫,藉助這些技術,製作一套6763個漢字大概一人半個月的時間即可完成。通過改變52個中文字母字的型狀和風格,很容易產生系列新字體。也可以無限擴大字數,由6763個漢字變為沒有數目限制的無限漢字字符集。
我們用「全信息漢字表達式知識庫」這個提法是因為計算機藉助知識庫的內容能夠理解漢字的結構和組成,並能寫出這個漢字,計算機具有寫漢字造漢字的的智能。計算機全信息漢字表達式知識庫應包括下面幾個內容(1)漢字獨體字和音旁字的全信息漢字表達式;(2)沒有收入到52個中文字母字的形旁字的全信息漢字表達式;(3)部份特殊複合字的遞歸定義式;(4)形旁字與聲旁字互相拼字的寬度表。
該同舟自動造字法將廣泛用於漢字的輸入、輸出設備。真正做到和實現了計算機自動造漢字。大大提高漢字字庫的生產效率。
說明書附面說明該圖是以「遞歸定義算法」和「全信息漢字表達式」顯示中文字母字組成漢字(以「啊」字為例)遞歸組字示意圖。以此種方法可以造出無窮盡個漢字,與英文字母造詞一樣簡單和容易。
權利要求
1. 不得將「同舟自動造字法」的中文字母字組字技術、形聲字的形旁字、聲旁字的遞歸定義造字原理、全信息漢字表達式知識庫等技術應用於非F系統的任何品牌的計算機製作任何造字軟體;
2. 不得將以上技術應用到非鍵盤輸入設備作為漢字輸入和造字軟體,或製成其他輸入法輸入和傳輸文字信息等。
3. 不得以上述技術配套其它品牌的計算機冒充尖端單字節漢字電腦。
全文摘要
本造字法以形聲字的造字規律,運用全信息漢字表達式知識庫和遞歸定義算法,在計算機一維平面自動生成漢字各種字體和字型。由於採用52個字母字組拼漢字,具有英文字母組單詞的無限擴充性,所造漢字內碼具有唯一性,故可造出無限個不同風格的漢字,而且在F系統規範下的計算機都可以讀出和列印出這些漢字。該造字法廣泛應用於漢字輸入、輸出設備等,實現了計算機自動造字的夙願,將大大提高漢字字庫的生成技術和效率。
文檔編號G06F17/00GK1294357SQ9911450
公開日2001年5月9日 申請日期1999年10月21日 優先權日1999年10月21日
發明者吳昌森, 周海籌, 唐秀昌, 鄭承梁, 何慶, 張彥紅 申請人:張彥紅

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀