數字式漢字心角處理系統的製作方法
2023-06-07 02:11:51 1
專利名稱:數字式漢字心角處理系統的製作方法
技術領域:
本發明涉及一種漢字的筆形編碼及其相應的數字電腦輸入鍵盤。
漢字是中國特有的文字,是由一些基本的筆劃構成的方框形圖案。目前雖有許多漢字編碼輸入方法,但他們仍存在著學習較難或重碼較多的缺點。如「四角號碼」編碼法,它雖然抓住了漢字四角這個外部特徵,但忽略了漢字的內部特徵,故重碼太多。又如中國專利85101817公開的「安子介式漢字筆形電腦編碼及其鍵盤」和清華大學出版社1995年6月出版的《縱橫漢字系統》等,它們基本上是四角號碼的基礎上增加了偏旁的2位碼,從四角碼變到了六角碼,但由於取碼部位和方法未作根本改進,因而重碼依然較多。在已公開的這類漢字輸入方法中,有的雖無重碼,但有一些字不是按規則編的碼,使用學習不便,沒達到易學易用的目的。
本發明的目的是提供一種數字式漢字心角處理系統。在「四角號碼」的基礎上,對漢字作進一步分解,即對取碼部位和筆畫的編碼方法進行改進,使其既有四角號碼易學易用、不易忘記的優點,又能克服重碼多的缺點。
本發明的具體方案是把漢字筆畫分成「撇、橫、豎、點與捺叉、插、方、角、人、小」10類,依次用0至9這10個數作它們的代碼,在漢字規定的部位上取碼,並在數字鍵盤上輸入相應的數碼,其特徵在於A.把10類漢字筆畫分別用1位數碼或2位數碼或4位數碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結構,其中包圍型分解為「框」和「心」,非包圍型分解為「字旁」和「字身」或兩個字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從「框」到「心」,從左上角到右下角、從上到下的順序和部位取碼,分別編為心角6位數字碼,心角8位數字碼。
下面結合筆畫分類及編碼表、漢字常見包圍結構和字例表以及心角編碼字例表對本發明進一步說明。
由筆畫分類及編碼表可知本發明借用「四角號碼」的編碼方法,把漢字筆畫分成「撇、橫、豎、點與捺叉、插、方、角、人、小」10類,依次用0至9這10個數作它們的代碼,在漢字規定的部位上取碼,並在數字鍵盤上輸筆畫分類及編碼表
漢字常見包圍結構和字例表
心角編碼字例表
入相應的數碼。前四類是單筆畫,其餘的是復筆畫。
從筆畫分類及編碼表、漢字常見包圍結構和字例表、心角編碼字例表進一步得知本發明對漢字作了分類,A.把10類漢字筆畫分別用1位數碼或2位數碼或4位數碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結構,其中包圍型分解為「框」和「心」,非包圍型分解為「字旁」和「字身」或兩個字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從「框」到「心」,從左上角到右下角、從上到下的部位和順序取碼,分別編為心角6位數字碼,心角8位數字碼。
一.本發明在漢字筆畫編碼上作了新的規定當「撇、橫、豎、點與捺」類筆畫取2碼或4碼時,在它們的代碼後面加1個0或3個0。例「舊」中的「丨」筆,取2碼為20,取4碼為2000。
當「叉」或「人」兩類筆畫取2碼時,在其代碼「4」或「8」後加上它們各自第二筆畫的代碼;當取4碼時,在其2碼後再加上第一、第二筆畫的代碼。如「全」中的「人」,在心角6位數碼中取83,在心角8位數碼中取8303。
在「插」類筆畫中,與另兩筆畫相交的筆畫叫作主筆畫,當「插」類筆畫取2碼時,在其代碼「5」後加上主筆畫的代碼,當取4碼時,在其2碼後依書寫序順加上另兩筆畫的代碼。如「草」中的「艹」,在心角6位數碼中取51,在心角8位數碼中取5122。
當「方」與「角」類筆畫取2碼時,在其代碼的前或後加一個0。
當「小」類筆畫取2碼時,在其代碼9後加上中間筆畫的代碼,取4碼時,在其2碼後依書寫順序加上另兩筆畫的代碼。如「系」中的「小」,在心角6位數碼中取92,在心角8位數碼中取9203。
本發明為了異化重碼,作了幾個特殊規定(1)「十」的2碼取40,4碼取4012;(2)左鉤取2,如「刂」的2碼取22,4碼取2022;(3)「八」取一碼時作8,取2碼為03,4碼為0030,(4)「訁」在6位數字碼中取2碼時,依「言」取為36;(5)若干個相同筆畫並排在一起取2碼時,第一碼取相同筆畫的個數,第二碼取筆畫的代碼。例如「灬」取43,「彡」取30;如只取一碼,則取筆畫的個數。
二.本方法把漢字的結構分為三類1.包圍型它又分為全包圍、三面包圍、兩面包圍、角包圍、以及由兩個不可分離的包圍結構組成的相連包圍。例如國、巨、王、這、慶、鳥、與。包圍型結構的漢字在外包圍的部分叫「框」,被包圍的部分叫「心」。
2.非包圍結構它又分為有不相連筆畫的分離型和筆畫全部相連的相連型,例如,合、魚、千、克。
3.交叉型它又分為不含包圍結構的純交叉型和含有包圍結構的包圍交叉型。例如,十、車、內、甲、申、電。「內」和「甲」的內部的筆畫只在上部或下部伸出框外,叫全包圍交叉型;「申」和「電」的內部的筆畫在上和下都伸出框外,叫半包圍交叉型。「心」伸出框外的部分叫「外心」,在框內的部分叫「內心」。
本發明根據漢字的類型、部首,各部分的縱橫排列的方向,按分離優先、交叉不拆的原則,把字分為若干個單元,小的單元叫字旁取2位數字作代碼,大的單元叫字身取4碼,字身一般又可分作兩字旁。
當把一個漢字分解成一個字旁和一個字身時,用字旁的2碼與字身的4碼合起來表示一個漢字,即為心角6位數字碼;當把漢字分解成兩個字身各取4碼時,即為心角8位數字碼。
三.字旁和字身的分解規則如下1.在心角6位數字碼中,包圍型漢字的字旁和字身的劃分是框作字旁,心作字身。例如「匡」的分解是「匚」作字旁、「王」作字身。
2.在心角6位數字碼中,非包圍型漢字的字旁和字身的劃分是A.如能分解為兩個並列的部分,那麼當其中只有一部分的筆畫超過3畫時,筆畫少的部分作字旁,另一部分作字身,例如「剛」中的「刂」作字旁;如這兩部分的筆畫都不超過3畫,當筆畫數相等時,取右面或上面的部分為字旁,當筆畫數不相等時,取筆畫少的作字旁。例如,「億」中「乙」作字旁,「仃」中的「亻」作字旁;如這兩部分都超過3畫,則當筆畫數相差不超過3畫時,取左面或上面的部分作字旁,當筆畫數相差超過3畫時,取筆畫少的部分作字旁。例如「耕」和「期」中的「耒」和「月」作字旁。
B.如漢字正好是分離或相連的並列三部分時,則把第一部分字旁,另兩部分合作字身,如「糊」中的「米」作字旁,「胡」作字身。
3.在心角8位數字碼中,包圍型漢字的劃分是「框」和「心」各作一字身,各取4碼。
例如「街」中的框「彳」和心「圭」各作一字身取4碼,其編碼是08414112。
4.在心角8位數字碼中,非包圍型漢字的劃分是A.如能分解為兩個並列部分則各作一字身;B.如正好分解為並列的三部分,則兩邊的部分合作一包圍型字身,中間部分作一字身。
例如「糊」中的「米…月」作一字身,「古」作一字身。
5.交叉型漢字和筆畫數不超過3畫的漢字皆只作字身取4碼,不足6或8碼的部分添0。
如「申」取6碼時為564600;取8碼為56460000;「於」取6碼為104200,取8碼為10420000;為異化重碼在心角6位數字碼中,下列部首隻作字旁,但它們單獨作字時照上述方法分解艹木竹酉頁口齒魚骨革金釒冖黑羽鳥皿心髟攵訁。
6.本發明將字身再分解為兩字旁的規則是A.如字身是包圍型的,則框和心各作一字旁,但如框的左上角附有一撇時,仍作包圍結構看,把撇作為框的左上角的筆畫;例如字旁「白」的取碼為01;B.如字身是非包圍型的,且能分作並列的兩部分,則各作一字旁;如「覃」中的字身「早」,分為「日」和「十」兩字旁;C.如字身剛好是分離或相連的並列3部分,則作為二面包圍類型把框和心各作一字旁。
如「贏」中的下部剛好是月、貝、凡並列,把「月…凡」作框, 「貝」作心。
四.字旁和字身的編碼方法(一)字旁的編碼1.包圍型字旁的取碼是角包圍則取包圍框的上一邊的筆畫代碼和心的左上角的筆畫代碼;多層包圍取最外框和最內的心的左上角代碼;其他包圍結構取框和心的左上角筆畫的代碼。
例如字旁「日」取碼為61。
2.非包圍型字旁的取碼是取它的左上角和右下角的筆畫代碼,或取上下或取左右筆畫的代碼。例如字旁「欠」取左上角和右下角代碼各為08,而字旁「文」的編碼為34。
如果字旁分離為並列的三部分時,按兩面包圍結構取碼。如「流」中的「 」作字旁,編碼為02。
如字旁是「叉、插、方、人、小」類筆畫時,則取它們相對應的筆畫的2碼作為這個字旁的編碼。如光的上部「 」是「小」類筆畫,取碼為92。
如字旁的上部或下部含有包圍結構時,則取其心的代碼作為左上角或右下角的代碼。例如「宿」中的字旁「百」的編碼為81。
如「點」畫在右上角時,則按右上角、左下角的部位次序取碼。例如,犬38,戈35。
3.交叉型字旁的取碼是如是純交叉型,一般取左上角、右下角的筆畫代碼,當是叉、插、方、人、小等類筆畫時,則按它們的2碼取碼。如「卅」取54,「艹取51」。
如是全包圍交叉型,則按外心,左上角或左上角、內心的順序取碼。如由取56,「甲」取65。
如果是半包圍交叉型時,取左上角、右下角筆畫代碼。例如「繩」中的字旁「電」取57。
(二)字身的編碼1.包圍型字身的取碼是角包圍分兩種情況,當包圍框的兩邊的筆畫數相差不到2時,按上下順序各取一碼放在首和尾,心取2碼放在中間,例如「溝」中的「勾」取0232;當框的兩邊的筆畫數相差達2畫時,或某一邊是交叉結構時,則取筆畫較多的一邊為字旁,取2碼放在前面,心取2碼放在後面,例如「波」中的「皮」取4714;其他包圍型字身,按框左上角、框右下角的部位和次序各取一碼放在首和尾,心作字旁取2碼放在中間;如漢字的框作字身碼不足時,在框角代碼的前面各添一個0。例如「國」的「口」作字身在左上和右下角各取2碼,但它們都只能取一碼6,故在這兩個6前各添一個0,故「國」的心角8位數字碼為06143106;又如「風」的8位數字編碼是07430307。
2.非包圍型字身的取碼是按分得的字旁各自取碼;當「點」畫在右上角時,取右上角的碼放在前面。
如「犬」作字身時,取碼為3048。
3.交叉型字身的取碼是A.純交叉型,按左上角和右下角各取2碼,左上角第2碼取主筆畫代碼,右下角取碼從左上角末取完的部位開始,末尾碼不足時添0;例「耒」取5249,「木」取4090。
B.金包圍交叉型,按外心、框左上角、內心、框右下角或框左上角、內心、框右下角、外心的順序和部位取碼,末尾碼不足時添0;例「油」中的「由」其內心已被外心取完,故內心取0,碼為5606。
C.半包圍交叉型,按在上的外心、框左上角、內心、內心的延伸部分等4個順序和部位取碼;例「申」取5640,「曳」取5657。
D.半包圍交叉型字身的左上角不構成「方」或「角」,則框的左上角取0。
例「隸」取5049,「巾」4702,「束」取5649。
4.異化重碼的取碼規則是交換首二碼位置或交換末二碼位置。
例「葒」和「蘊」的編碼都是512112,若改「葒」的編碼為512121,則可使兩碼區別開。
5.非漢字的符號一律按字身取碼規則取4碼放在末尾,前面的碼一律取0。
例區位碼為6019的「艹」取005122,區位碼為6760的「丬」取008120。
本發明的優點是抓住了漢字包圍結構的重要特點,把漢字的外部和內部特徵統一在編碼中,故重碼很少。由於無字根、規則性強,所以易學難忘。字符集可擴充至大漢字集,且重碼少。
權利要求
1.一種數字式漢字心角處理系統,把漢字筆畫分成「撇、橫、豎、點與捺叉、插、方、角、人、小」10類,依次用0至9這10個數作它們的代碼,在漢字規定的部位上取碼,並在數字鍵盤上輸入相應的數碼,其特徵在於A.把10類漢字筆畫分別用1位數碼或2位數碼或4位數碼作代碼;B.把漢字分為包圍型、非包圍型、交叉型三類結構,其中包圍型分解為「框」和「心」,非包圍型分解為「字旁」和「字身」或兩個字身,交叉型不分解;C.把字身再分解為兩字旁,但交叉型字身不分解;D.字旁取2碼,字身取4碼,按從「框」到「心」,從左上角到右下角、從上到下的順序和部位取碼,分別編為心角6位數字碼,心角8位數字碼。
2.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於漢字筆畫中「撇、橫、豎、點與捺」類筆畫取2碼或4碼時,在它們的代碼後面加1個0或3個0;「叉」和「人」類筆畫取2碼時,在其代碼「4」或「8」後加上它們各自第二筆畫的代碼;當取4碼時,在其2碼後再加上第一、第二筆畫的代碼;「插」類筆畫中,與另兩筆畫相交的筆畫為主筆畫;在「插」類筆畫取7碼時,在其代碼「5」後加上主筆畫的代碼,當取4碼時,在其2碼後依書寫序順加上另兩筆畫的代碼,當取4碼時,在其2碼後依書寫順序加上另兩筆畫的代碼;「方」與「角」類筆畫取2碼時,在其代碼的前或後加一個0;「小」類筆畫取2碼時,在其代碼「9」後加上中間筆畫代碼,取4碼時,在其2碼後依書寫順序加上另兩筆畫的代碼。
3.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於當把一個漢字分解成一個字旁和一個字身時,用字旁的2碼與字身的4碼合起來表示一個漢字,即為心角6位數字碼;當把漢字分解成兩個字身各取4碼時,即為心角8位數字碼。
4.根據權利要求1或權利要求3所述的數字式漢字心角處理系統,其特徵在於在心角6位數字碼中包圍型漢字的字旁和字身的劃分是字框作字旁,字心作字身。
5.根據權利要求1或權利要求3所述的數字式漢字心角處理系統,其特徵在於在心角6位數字碼中,非包圍型漢字的字旁和字身的劃分是A.如能分解為兩個並列的部分,那麼,當其中只有一部分筆畫超過3畫時,筆畫少的部分作字旁,另一部分作字身;如這兩部分的筆畫都不超過3畫,當筆畫數相等時,取右面或上面的部分為字旁,當筆畫數不相等時,取筆畫少的作字旁;如這兩部分都超過3畫,當筆畫數相差不超過3畫時,取左面或上面的部分作字旁,當筆畫數相差超過3畫時取筆畫少的部分作字旁;B.如漢字正好是分離或相連的並列三部分,則把第一部分作字旁,另兩部分合作字身。
6.根據權利要求1或權利要求3所述的數字式漢字心角處理系統,其特徵在於在心角8位數字碼中,包圍型漢字的劃分是「框」和「心」各作一字身,各取4碼。
7.根據權利要求1或權利要求3所述的數字式漢字心角處理系統,其特徵在於在心角8位數字碼中,非包圍型漢字的劃分是A.如能分解為兩個並列部分則各作一字身;B.如正好分解為並列的三部分,則兩邊的部分合作一包圍型字身,中間部分作一字身。
8.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於交叉型漢字和筆畫數不超過3畫的漢字皆只作字身取4碼,不足6或8碼的部分添0。
9.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於字身再分解為兩字旁的規則是A.如字身是包圍型的,則框和心各作一字旁,但如框的左上角附有一撇時,仍作包圍結構看,把撇作為框的左上角的筆畫;B.如字身是非包圍型的,且能分作並列的兩部分,則各作一字旁;C.如字身剛好是分離或相連的並列3部分,則作為二面包圍類型把框和心各作一字旁。
10.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於包圍型字旁的取碼是;角包圍則取包圍框的上一邊的筆畫代碼和心的左上角的筆畫代碼;多層包圍取最外框和最內的心的左上角代碼;其他包圍結構取框和心的左上角筆畫的代碼。
11.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於非包圍型字旁的取碼是取它的左上角和右下角筆畫的代碼,或取上下或取左右筆畫的代碼;如字旁分離為並列的三部分,按兩面包圍結構取碼;如字旁是「叉、插、方、人、小」類筆畫時,則取它們相對應的筆畫的7碼作為這個字旁的編碼;如字旁的上部或下部含有包圍結構時,則取其心的代碼作為左上角或右下角的代碼;如「點」畫在右上角時,則按右上角、左下角的部位次序取碼。
12.根據權利要求1所述的數字式漢字心角處理系統,其特徵在於交叉型字旁的取碼是一般取左上角和右下角的代碼,當是叉、插、方、人、小等類筆畫時,則按它的2碼取碼;如字旁是全包圍交叉型,則按外心、左上角或左上角、內心的順序取碼;如字旁是半包圍交叉型時,則取左上角、右下角的筆畫代碼。
13.根據權利要求1或權利要求9所述的數字式漢字心角處理系統,其特徵在於包圍型字身的取碼是;角包圍分兩種情況,當包圍框的兩邊的筆畫數相差不到2時,按上下順序各取一碼放在首和尾,心取2碼放在中間;當框的兩邊的筆畫數相差達2畫時,或某一邊是交叉結構時,則取筆畫較多的一邊為字旁,取2碼放在前面,心取2碼放在後面;其他包圍型字身按框左上角、框右下角的部位和次序各取一碼放在首和尾,心作字旁取2碼放在中間;如漢字的框作字身碼不足時,在框角代碼的前面各添一個0。
14.根據權利要求1或權利要求9所述的數字式漢字心角處理系統,其特徵在於非包圍型字身取碼是按分得的字旁各自取碼;當「點」畫在右上角時,取右上角的碼放在前面。
15.根據權利要求1或權利要求3所述的數字式漢字心角處理系統,其特徵在於交叉型字身取碼分下列幾種情況A.純交叉型,按左上角和右下角各取2碼,左上角第2碼取主筆畫代碼,右下角取碼從左上角末取完的部位開始,末尾碼不足時添0;B.全包圍交叉型,按外心、框左上角、內心、框右下角或框左上角、內心、框右下角、外心的順序和部位取碼,末尾碼不足時添0;C.半包圍交叉型,按在上的外心、框左上角、內心、內心的延伸部分等4個部位和順序取碼;D.半包圍交叉型字身的左上角不構成「方」或「角」時,則框的左上角取0。
全文摘要
本發明涉及一種數字式漢字心角處理系統,它在四角號碼的基礎上,改進了筆畫代碼和取碼部位,仍用10個數字給漢字編碼,由於它碼元少、規則性強、無字根、重碼少、故易學易用,可用於計算機輸入漢字。
文檔編號G06F3/023GK1189645SQ97107350
公開日1998年8月5日 申請日期1997年1月28日 優先權日1997年1月28日
發明者謝力 申請人:謝力