電腦漢字三維天然編碼方法及鍵盤的製作方法
2023-05-09 21:31:16
專利名稱:電腦漢字三維天然編碼方法及鍵盤的製作方法
技術領域:
本發明屬於漢字信息處理技術領域,尤其涉及一種電腦漢字形碼輸入方法。
現有的漢字編碼主要分為「音碼」、「形碼」、「音形結合碼」三大類。「音碼」的弊端很多,「形音結合碼」也染上了「音碼」的弊端。現有技術中,與本發明同性質的「形碼」主要有王永明的「五筆字形″編碼法和陳愛文的″表形符號″編碼法(專利號CN85105556)。前一種編碼方法對普及電腦作出了很大的貢獻,但由於其編碼的「人為硬性規定」,歸類方法難免帶有強求性,字根與代碼之間的聯繫缺乏直觀規律性,因而,記憶量大,重碼較多,難學易忘。相比之下,陳愛文的「表形符號」編碼法較前者有所革新、有所進步,但是由於它單純從外形入手,未能揭示漢字這種象形文字的內在結構規律,因而對大量的重碼只能用音碼來擇重,採用了「形音結合」的方法,染上了「音碼」的諸多弊端,對不認識的字或讀音不準的字難以處理,加上硬性規定的代碼也較多,記憶負擔重,學起來沒有拼音碼容易,用起來沒有五筆型方便,因而與前者一樣不利普及。究其實質,現有漢字編碼方法的共同弊端是僅僅只使用了漢字的外部信息,而漢字的內在結構的本質規律卻無法涉及。
本發明的目的就是提供一種能反映漢字的內在結構規律,記憶負擔少、無重碼的計算機漢字形碼輸入方法。
本發明的技術方案是首先以通用電腦鍵盤為基礎,在數字鍵1-9和字母鍵A-Z共計35個鍵帽上貼上一種大小寫字符能同時顯現的鍵帽標籤,作為漢字拆字或編碼的基準。這種以35個鍵位表示70個符號的鍵盤,本發明稱之為「天然代碼鍵盤」。
然後,從組成漢字的基本筆劃和常用偏旁部首中歸納出240個組字部件作為字根,字根又包括天然字根和派生字根兩種,天然字根是通過與天然代碼鍵盤相比較,在滿足「筆畫數相等」或「筆畫形相近」或「特徵點相同」的天然相以原則基礎上產生的,它們是最基本的獨立組字部件,不再拆分。除天然字根外的其餘字根稱為派生字根,派生字根是由天然字根派生而成,即在某個天然字根的基礎上再附綴另一天然字根而成,附綴上去的那個天然字根叫字綴。並根據上述天然相似原則,將天然字根和派生字根全部定位到本發明的天然代碼鍵盤的70個符號上。
上述所說「筆畫數相等」是指用零散的筆畫組合而成的字根的筆畫數值與其所定位的代碼數值大小相等。如「氵、巛、小」等字根的筆畫數都是3畫,其代碼定位在數字鍵3上。以這種方式定位的鍵位只有2、3、4、5、6等筆畫的5種字根;「筆畫形相近」是指某些字根的筆畫形態與這些字根所定代碼的直觀形態相近。如「七、匕、車」的形態都與「七」相近,所以其代碼定位在「七」上;再如「馬、買、刁」等字根的形態與「7」相近,其代碼定為「7」,「七」和「7」在本發明的天然代碼鍵盤上為同一鍵位,輸入時不需切換。以這種方式定位的代碼約佔全部字根的五分之三;而「特徵點相同」是指某些字根所體現的主要特徵點與其所定位的代碼的主要特徵點相同。如「舟」以兩點為特徵,代碼定為2;再如「米」以四點為特徵,代碼定為4;再如「木、本、未」等字根都是以八字支撐為其特徵,類似「八」,取代碼為8。按這個原則定位的代碼約佔全部代碼的三分之一。
本發明將漢字看成是「字根、字綴、字型這三維信息構成的結合體(「字型」即字根與字根的組合形態)。並採用「字根為主、字綴為輔、字型為補」的主要原則和以下一般性原則對漢字進行編碼及輸入。所述一般性原則是指每個漢字最多取4碼,最少取1碼,不足4碼的用空格鍵結束出字,多於4碼的取1、2、3、末碼自然出字;取碼順序完全與漢字的規範化書寫順序同步,即先上後下,先左後右,先外後內;對於拆分複雜的字根,取碼時則應做到多筆畫字根優先。例如「新」字,應拆分為「立、木、斤」,代碼為「58K」不應拆分為「六、一、木、斤」。
以上所說「字根為主」一是指對所有漢字取碼時首碼必須是字根碼;二是指字根等於或多於4個的漢字必須全部取用字根碼。字根為主又分三種情況①對於4碼以下的漢字,取碼順序完全與漢字的規範化書寫順序同步,使打字與寫字的感覺一致。如「留」字,先上後下,取碼為「GNU」;如「咖」字,先左後右,取碼為「O7O」等。
②對於「重心在中間」的漢字,如合體字「微」,是左中右三部分,則按「重心在中間」的原則,中間取上下2碼,應取「彳、山、幾、攵」,代碼為「1E9R」。再如「贏」字是上中下與左中右的結合體,按「重心在中間」的原則,應取「亠、L、口、貝」,代碼為「iLOK」,兩邊忽略不計碼。
③對於「主幹分明」的漢字,取碼應優先主幹。例如「猿」字,右邊是主幹且複雜,應該優先主幹,所以左邊只取1碼,右邊取三碼,代碼為「XYOK」。再如「狄」,右邊簡單,應左右均衡以保持重心在中間,所以左邊應取2碼,代碼為「XJ4」。一般情況下,左偏旁按「上下2碼」的原則取碼。
所謂「字綴為輔」即對取碼不足3碼且末字根為派生字根的漢字應輔加字綴碼。例如獨體字「夫」,其形是「大」字多一橫,其字根碼是「W」,字綴碼為「一」,「夫」字的代碼為「W1」;同樣,″夷″字的形象是「大」字夾″弓″,其字根碼是「W」,字綴碼為「M」,「夷」字的代碼為「WM」;再如「耒」字,是「木」字多二橫,應先取字根碼「八」,再輔打其字綴碼「二」,代碼為「八二」;「廿、甘」都是「橫筆穿豎型」,一個是「艹」字頭下多一橫,一個是「艹」字頭下多兩橫,所以,「廿」的代碼是「H1」,「甘」的代碼是「H2」。凡是此類簡單漢字或獨體字,應先取字根碼,再取字綴碼,即字根輔字綴。若末字根沒有字綴則不必加碼。「字綴碼」是「三維天然碼」能自動消除重碼的訣竅。
所說「字型為補」,即對取碼不足3碼且具備如下字型結構的漢字補打字型碼。這是因為有些漢字的字根相同,但由於其組合與排列的形式不同,也會形成不同的漢字。例如「田」和「葉」字,它們的字根都是「口」與「十」,但前者是「包容型態」,後者是「並立型態」;再如「果」和「杲」字,字根都是「日」和「木」,前者是「插入型態」,後者是「頂立型態」。這兩組漢字由字根法取碼後,其代碼相同,若補打字型碼就體現了其本質區別,可以避免重碼。漢字的字型型態很多,而且有些漢字難辨其型,本發明只優選了三種最單純直觀的字型型態,其它字型則不予理睬,以減少思索和擊鍵次數①頂立型態用「B」鍵表示,形似上下頂立狀。如「呂」字,字根代碼為「OO」,因不足4碼,加字型碼「B」,其代碼為「OOB」。「唄、員」的代碼均為「OK」,三維天然碼對後者加「B」就予以剔重了。
②插入形態用「V」鍵表示,形似插入狀。如「執」字和「擾」字,字根代碼均為「f九V」,但前者的「點」插入「九」字,應加字型碼「V」,其代碼為「f九VV」。再如「永」字,取碼為「jXV」。
③包容型態用「C」鍵表示,形似包圍狀。如「閒」字,代碼為「M8」,加字型碼「C」,其代碼為「M8C」。再如「匡」字,取碼為「CZC」。
三維天然碼規定,凡不足三碼的漢字,只要符合字型條件,均可加一型態代碼;凡已足三碼的非常用字,只要符合字型條件,也應加一型態代碼;凡不具備字型條件的漢字,一律不加字型碼,以減少擊鍵次數。
對於詞組的編碼,本發明有如下規則①2字詞組取各字的前兩碼。如「學習」的代碼為「3M72」。
②3字詞組首字取前兩碼,第二、第三字各取其首碼。如「計算機」,代碼為「ixk8」。
③4字詞組取各字首碼。如「天然代碼」的編碼為「1DC6」。
④5字詞組取前三字和末字的首碼。如「中央委員會」的編碼為「QnTA」。
⑤多字詞組取前三詞的首字首碼和末字的首碼。如「中華人民共和國」,代碼為「QAHG″。
由於本發明採用漢字的「字根、字綴、字型」這三維信息拆字或編碼,立體地揭示了漢字的內在組合結構規律,並充分利用字根與代碼之間的天然直觀聯繫,強化了見形識碼的效果,因而具有如下優點第一、記憶量極小。它不象有些編碼那樣需要死記硬背繁複的字根及其人為規定的鍵位,而是按照字根與鍵盤符號的天然聯繫「見形取碼」,幾乎不用記憶就能「對號入座」。例如「I」字母與「工廠」的「工」字同形,「J」字母與「工廠」的「廠」字近形,輸入「工廠」二字,只要擊「I,J」二鍵即可。再如「A」字母與「人」字象形,「O」字母與「口」字同形,擊「A、O」鍵就能輸入「合」字。既直觀又直接,既好記又好用,跟手寫電腦一樣方便,但速度更快。這種直觀簡明的輸入方法,符合人們識字寫字的拼合規律和拆分習慣,只要認識數目字一至九和字母A至Z共計35個符號的人,均可在35分鐘左右學會此輸入方法,三五天就能輕鬆自然地進入「電腦寫字」的自由天地。
第二、可學性極強。它不象「拼音碼」那樣要以標準的普通話為基礎,而是不受方言和國界的限制,不受識字水平和文化素養的限制,只要按漢字的組合形態拆分取碼,採取「字根為主,字綴為輔,字型為補」的原則編碼,任何複雜的漢字均可在4碼內拼出,且沒有重碼,使用戶充滿自信;同時,由於三維代碼與鍵盤符號具有天然聯繫,用戶不僅一看就懂,一試就會,而且可以同時調動其形象思維和邏輯思維,使打字充滿樂趣;更有天然形成的一、二、三級簡碼無須記憶,碼到字成,使電腦輸入漢字就象輸入拼音文字一樣直觀簡便。只要掌握了漢字書寫的筆順和三種字型結構(頂立型B,插入型V,包容型C)初識漢字的外國人也可在電腦上「書寫漢字」,是漢字走向世界的得力助手。
第三、實用面極廣。它不象有的編碼那樣使電腦打字成為一種需要艱苦訓練的專業,而是使之成為一種極富樂趣的享受。從基礎教育來看,由於這種方法完全按照字形信息編碼,揭示了漢字的字根、字綴、字型這三維信息的組合規律,因而可以改變現有漢字輸入方法與寫字教學相脫離的現狀,既藉助了人們現有的識字水平,又優化了人們現有的寫字方法,還可以真正使電腦打字與寫字教學結合起來,在廣大中小學全面推廣、普及,不僅不影響寫字教學,反而有助於優化寫字教學,優化識字教學;從現代辦公來看,一般的機關幹部、編輯、記者等文字工作者,完全可以免去「勤學苦練」這一關,一小時進入「無師自通」的境界,一星期達到「運用自如」的境地;從文化建設來看,由於這種方法揭示了漢字的本質規律,因而沒有重碼,除了可作電腦輸入方法外,還可以作為電報碼及字典、詞典等中文工具書的檢索排序工具。
圖一為字根與天然代碼鍵盤的70個符號的對應關係;圖二為天然代碼鍵盤示意圖。
權利要求
1.一種電腦漢字三維天然形碼編碼方法及鍵盤,該方法包括從組成漢字的基本筆畫和常用偏旁部首中歸納出若干組字部件作為字根,並將字根定位到電腦鍵盤上的字母和數字鍵位上,以字母和數字符作為字根的代碼,其特徵在於所述字根是根據「筆畫數相等」或「筆畫形相近」或「特徵點相同」的天然相似原則定位到天然代碼鍵盤的字母和數字鍵鍵位上;並將漢字看成是由字根、字綴、字型這三維信息構成的結合體。採用「字根為主、字綴為輔、字型為補」為主要編碼原則對漢字進行編碼及輸入。
2.根據權利要求1所述的電腦漢字三維天然形碼編碼方法及鍵盤,其特徵在於所說天然代碼鍵盤是以通用電腦鍵盤為基礎,在數字鍵1-9和字母鍵A-Z鍵帽上貼上一種大小寫字符同時顯現的鍵帽標籤而成。
3.根據權利要求1所述的電腦漢字三維天然形碼編碼方法及鍵盤,其特徵在於所述字根包括天然字根和派生字根共計240個,與天然代碼鍵盤上的70個符號對應關係如下
全文摘要
本發明屬於漢字信息處理技術領域,尤其涉及一種電腦漢字形碼輸入方法及鍵盤。該方法是將組成漢字的字根依據「筆畫數相等」或「筆畫形相近」或「特徵點相同」的原則定位到天然代碼鍵盤的字母和數字鍵鍵位上;並將漢字看成是由字根、字綴、字型這三維信息構成的結合體,採用「字根為主、字綴為輔、字型為補」為主要編碼原則對漢字進行編碼及輸入。
文檔編號G06F3/023GK1143766SQ9510087
公開日1997年2月26日 申請日期1995年3月14日 優先權日1995年3月14日
發明者張得一, 張青峰 申請人:張得一