新四季網

計算機漢字同構輸入法的製作方法

2023-04-29 05:46:06 4

專利名稱:計算機漢字同構輸入法的製作方法
技術領域:
本發明屬於計算機漢字輸入方法的領域,特別涉及到一種利用漢字同構的輸方法。
現有漢字輸入方法不下數百種,它們大致可以分為三種類型向計算機內輸入,即用語音輸入、用手寫輸入和鍵盤輸入。這三種類型均在使用中,但它們各有不足之處1、語音輸入難於推廣,主要原因有二,一是不同的漢字發音僅有四百多,而不同的漢字,僅一二級漢字就有六千多個,同音字太多了,僅靠聲音是很難區分的;二是同一漢字不同地域的發音差別很大,不同地方的人聽對方說話,常有困難,何況機器?2、手寫輸入至今沒有擊鍵盤輸入普及,主要原因也有兩個一是現有技術對手寫漢字的識別率不高,且近期難於達到實用的程度;二是手寫漢字識別需要一些特殊的軟、硬體,且目前價格相對較高。
3、鍵盤輸入方法也有數百種,這裡只談常用的具有代表性的三種五筆字型(即王碼)、拼音輸入法和五筆劃輸入法。
五筆字型的主要優點是重碼率低,若掌握其編碼規則後,輸入速度較快,但其致命弱點是其編碼規則較難掌握,即使掌握,若不常用也易忘。
拼音輸入的主要缺點是重碼率高,單就一二級漢字來說有六千多個,但不同的漢字發音方法,只有四百餘個,因而其平均重碼率就超過10,編碼相同的漢字可以多達上百個,所以,其輸入速度很低。它的另一大缺點是除華北人外,其他地方人的漢語拼音一般撐握不準,因而,用它輸入漢字速度就更低,何況,還有不少人不會漢語拼音。
五筆劃方法的主要缺點是它的重碼率與漢語拼音方法不相上下,所以,它的輸入速度也很低,喜歡用的人不多。
綜上所述,目前的漢字輸入方法,或因其技術尚未達到普及的程度,或因其價格較高,或因其編碼規則難於掌握,或因其重碼率過高,因而在目前使用它們的人比例不大。為了改革開放的需要,中國要走向世界,儘早的與國際接軌,所以如何去開發一種更具有進步性,能使廣大民眾易於接受的既快捷又準確的利用計算機輸入漢字的新方法,就成為當前急待解決的問題。
本發明的目的為了克服已有諸多的漢字輸入方法中存在的難掌握、難記憶及重碼率高等缺陷,我們試圖尋找一種新的漢字輸入方法,其編碼規則要簡單到任何一個會寫漢字的人,都能輕鬆地掌握它,而且,只用10個數字鍵不附加西文字母鍵就能輸入所有漢字,它的重碼率顯著地比拼音輸入法和五筆劃方法低,同時輸入的速度明顯的快,並且本輸入方法能成為僅用10個數字鍵的手機和掌上電腦就可以實現高效輸入漢字的方法,而目前使用較廣的計算機鍵盤輸入方法,都必須用26個英文字母才能輸入漢字,既不容易推廣,也不宜在手機和掌上電腦上使用;本方法是為了尋求徹底更新並宜於推廣的新方法。
本發明的目的是依靠以下技術方案來實現的一種計算機漢字同構輸入方法,包括如下幾個部分(1)基於已有技術中的漢字筆劃分類方法,將漢字筆劃按走向與形狀分為橫、豎、撇、捺、折五類,並依次賦以編碼,現列表如下表1筆劃名稱 筆划走向 筆劃及其變形 筆劃編碼橫左→右一
1豎上→下丨亅 2撇右上→左下丿
3捺左上→右下丶 4折帶轉折
5
(2)選擇對重碼率影響最大的漢字部件19個,作為關鍵部件,將它們分成5類,多數為具有左偏旁的部件,並賦以編碼6、7、8、9、0,現列表如下表2
對於表2的助記規則是蟲草魚絲,編碼0;石犬木馬,編碼9;人言金女子,編碼8;(三點)水車足走之,編碼7;提手口旁,編碼6。
(3)其它重要漢字部件或會含有表1中定義的折筆劃,或含有最長的一個非折筆劃,我們稱這樣的折筆是或最長筆劃為特徵筆劃,並將這些部件按特徵筆劃分類,賦於他們的編碼是,其特徵筆劃的編碼就是該部件的編碼。現列表如下
表3
其他未列入表內的左偏旁部件,其編碼也是由其特徵筆劃編碼而定。
對於表3的助記規則是立刀刂編碼2;反文交旁編碼4;見力鳥,各欠戈,頁亥瓜,右雙包,編碼全是5。
(4)所說的同構漢字,其定義為對於任一漢字,若其內含有表2中所列關鍵部件,或含有表3中所列重要部件,則稱為同構字,否則稱非同構字;此為本發明的基石包括同構漢字與非同構漢字總合的輸入方法稱漢字同構輸入方法。
(5)單個字的漢字同構輸入方法依據如下的編碼進行計算機輸入,其中單字的編碼至多五位數字如「數」的編碼為43314;「下」的編碼為124;規則(a)非同構漢字的編碼由其前兩筆和最後叄筆的編碼組成,不足五筆的由其全部筆劃的編碼組成;如「重」的編碼是31121;如「同」的編碼是25251,「上」的編碼是211;規則(b)同構漢字的編碼是這樣規定的(b1)對右偏旁同構漢字,由其非同構部分的前兩筆、最後兩筆和上述右偏旁的編碼組成。
如「到」的編碼為15212;「放」的編碼是41354;「鶴」的編碼是35215(b2)對非右偏旁的其他同構漢字,其編碼由它的左偏旁或部首的編碼和非同構部份的前兩筆與最後兩筆的編碼組成。
如「紹」的編碼是05351;「構」的編碼是93554;「避」的編碼是75112;搞的編碼是64151。
若非同構部份的編碼不足四筆,則由這部份的全部筆劃的編碼和其偏旁或部首的編碼組成。
如「如」的編碼是8251;「碼」的編碼是9551。
對於上述規則應特別注意的是,對右偏旁同構漢字,其偏旁的編碼放在其編碼的最後一位,而其他同構漢字,其偏旁或部首的編碼位於其編碼的第一位;作這種規定的目的是要降低漢字編碼的重碼率。對於上述規則,可總結在表4中表4
1)如全部筆劃少於5劃者,採用其全部筆劃的編碼,例「木」,其編碼為1234;2)如非同構部分少於4劃,用部件碼和這部分全部筆劃的編碼,例「們」其編碼為8425。
以示例一欄中所列「搞」字作一說明,左偏旁部件為提示,部件碼為6,非同構部件前兩筆中第一筆「丶」編碼為4,第二筆「一」編碼為1,最後兩筆中倒數第二筆「乛」編碼為5,最後一筆「一」編碼為1,故為64151。
(6)對於高頻字的特殊處理眾所周知,漢字中有不少高頻字,如的、經、我、是等等,按上述規則,這些高頻字的編碼長度多數為5,為進一步提高錄入速度,就對這些常常出現的高頻字作了一些特殊處理,我們引入了一級、二級、三級簡碼的概念,所謂一級簡碼就是只需擊一個數字鍵和空格鍵就可輸入的,我們稱為一級簡碼(漢字),同理,只需擊兩個數字鍵和空格鍵就可輸入的,我們稱為二極簡碼(漢字),依此類推。為便於敘述,我們把高頻字原來的編碼稱為原碼,如「是」的原碼是25134,而它的簡碼是2,換句話說,用同構輸入法錄入時,鍵入2和25134都可以輸入「是」字,因此不難看出用簡碼錄入,可以大大提高錄入速度。
表5、表6和表7分別給出了一級、二級和三級簡碼,其中,一級簡碼字達10個,二級簡碼字共50個,三級簡碼字共250個,當然,這310個漢字的簡碼絕大數都比它們的原碼短,在錄入過程中,用簡碼和原碼都可以,例如「我」字,用它的簡碼「3」和原碼「31534」都能輸入。實際上,如一個字有簡碼,則它的簡碼一定是其原碼的第一位,或前兩位,或者前三位,因此,不必記它,只需在錄入原碼的同時,盯著屏幕下方的提示行,一旦所要的字出現,就按選擇鍵即可。
可以看出,簡碼的長度絕大多數都比它們各自的筆劃少,而且,幾乎都是常用字,所以,本輸入法的錄入速度肯定是快的。
以下是簡碼錶,表5-表7表5一級簡碼漢字 經 在 是 我 望 的 折 法 你 校編碼 0 1 2 3 4 5 6 7 8 9表6二級簡碼漢字 結 細 繪 統 藝 王 要 不 來 到編碼 01 02 03 04 05 11 12 13 14 15漢字 些 和 小 常 中 生 白 原 人 用編碼 21 22 23 24 25 31 32 33 34 35漢字 主 同 為 學 良 民 了 發 又 禮編碼 41 42 43 44 45 51 52 53 54 55漢字 技 提 換 接 指 漸 澡 沒 這 通編碼 61 62 63 64 65 71 72 73 74 75漢字 做 保 作 們 他 標 獨 驗 樣 椐編碼 81 82 83 84 85 91 92 93 94 95
表7三級簡碼
<
(7)關於詞組的同構輸入方法本發明中,對於詞組的編碼也不超過5位,其編碼規則如下①兩字詞組每字的前兩碼;如鍵入4位數碼之後提示行內未出現所需詞組,則追加識別碼0。
例如「詞組」→8502;「編碼」→0495;鍵入4位數碼後出現了所需詞;「規則」→11250;鍵入4位數碼後未出現所需字,則追加識別碼,即出現所需詞組。
②三字詞組前兩字首碼和末字的前兩碼;如鍵入4位數碼之後提示後內未出現所需詞組,則追加識別碼0。
例如「中關村」→2491;健入4位數碼已出現所需要詞;「北京市」→24410;需要追加識別碼;③四字以上詞組前三字與末字的首碼。如鍵入4位數碼之後提示行內未出現所需詞組,則追加識別碼0。
例如「暴風驟雨」→2391,不必加識別碼即出現所需詞。
「中華人民共和國」→23320,鍵入4位數後,末出現所需詞,追加識別碼0即可。
每鍵完4碼是否追加識別碼的問題,是無須單獨記憶與劃分的,眼盯屏幕即可順意操作。
本發明的積極效果,與已有技術相比,有以下幾個方面1、本方案易掌握記憶量小,五筆字型是用130個字根進行編碼的,要使用五筆字型輸入必須要記住130個字根及它們的編碼,而同構字輸入法需要記憶的是19個關鍵部件及他們的編碼,兩者的記憶量之比為130∶19。
2、對初學者而言,五筆字型法的拆字關是難過的,本方案則無拆字關可言。
3、需要用十個手指頭擊打26個英文字母鍵,而本方法在擊鍵過程中,只需用5個手指在0-9的阿拉伯數字上移動,擊鍵範圍大大縮小。
4、最大的特點是在只有數字的手機上或掌上型電腦上使用,其錄入效果比任何一種方法都更有現實性及方便性,尤其對於需要頻繁地輪流錄入數字和漢字的場合(如金融界前臺操作員、醫院、商店、飯店收款員等),若用同構法輸入漢字,他們只需要用阿拉伯字小鍵盤就能完成任務。而且本方案一旦掌握,不易忘記。
5、本同構漢字輸入法的輸入效率較高,錄入過程中翻頁次數最少。
統計結果證明,在六千多個一二級漢字中,只有360餘個生闢字需要翻頁才能找到,同時,百分之八十以上的常用漢字,用其編碼和空格鍵即可輸入,所以,與全拼輸入法和五筆劃輸入法相比,同構法的重碼率比它們低得多,因而,同構法的錄入效率也要高得多,見附圖2a、2b,擊鍵後往往都要多次翻頁才能找到所需字,而本方法無需翻頁。例入鍵入漢字「漸」,用本同構法簡碼是「71」,不需翻頁即可顯示,而用全拼輸入時,要鍵入字母串jian外還要翻3頁,即要肉眼在近40個漢字中找出此字,既費時間也費眼睛,時間慢,效率低。圖3說明本同構輸入法編碼長度比五筆劃的短,錄入時也無需翻頁,全拼和五筆劃方法是作不到這一點的。
和手寫輸入比較,由於本發明中引入了一、二、三級簡碼概念,在使用同構法錄入時,大多數漢字的碼長都比它的筆劃少,如「我」的簡碼是3,碼長只有1位,而它有7劃;「望」的簡碼是4,碼長也是1,而它有11劃,擊一下鍵的速度比寫7劃、11劃的速度快多少倍?所以,同構法的錄入速度肯定賽過手寫,而且要快得多。不僅如此,手寫輸入法還需要一種特殊的寫字筆和寫字屏,因而,其成本比同構法高。錄入效率和成本上的優勢,必將轉化為競爭優勢。
可以預言,漢字語音輸入法的效率,在今後相當長的時間內,是趕不上本方法的,何況,和語音輸入法比,同構法同樣擁有準確性及成本上的優勢。
綜上所述,同構漢字輸入法明顯地具有各種綜合優勢;就是易學、易掌握、不易忘;錄入效率高,重碼率低,成本低。
目前,用手機上網交流是一大趨勢,若全世界數以億計的華人上網交流、寫作,他們的主要語言自然是漢語,同構法將成為多數人的首選;隨著物質供應的日趨豐富,二十年前隨處可見的排隊現象,現在,在銀行、醫院和其他一些繳費場所依然存在,若用同構法來提高有關人員的工作效率,是可以緩解排隊問題的,所以,我們深信同構法的多項優勢使她具有廣闊的應用空間和應用前景。
下面結合附圖進一步說明本方法的實施例情況。


圖1是本同構輸入法與五筆字型輸入法之間的編碼長度比較。
圖2a是對於單個漢字,拼音輸入法與同構輸入法翻頁次數比較。
圖2b是對於詞組,拼音輸入法與同構法翻頁次數比較。
圖3是五筆劃輸入法與同構輸入法編碼長度與錄入效果比較。
圖4是利用同構輸入法編碼字典舉例。
實施例我們把漢字同構輸入法嵌入UCDOS作業系統中,在WPS和EDIT兩種編輯器內進行了錄入實驗,實驗結果證明我們發明目的達到了,而且效果甚佳,表7表明了利用同構法輸入法錄入漢字編碼的一部分。
權利要求
1.一種計算機漢字同構的輸入方法,包括將漢字筆劃按走向與形狀分為橫、豎、撇、捺、折5類;其特徵在於,將5類筆劃分別賦以數字編碼1、2、4、5;將5組關鍵部件分別賦以6、7、8、9、0;將其他重要漢字部件按特徵筆劃分類,賦以他們的編碼規則是,其特徵筆畫所賦以的編碼就是該部件編碼,漢字同構法進行計算機輸入時,按下列步驟進行(1)單個漢字輸入,其編碼至多5位數字規則a非同構漢字的編碼,由其前兩筆和最後三筆編碼組成,不足5筆的由其全部筆劃的編碼組成。規則b同構漢字的編碼b1)對右偏旁同構漢字,由其非同構部分的前兩筆,最後兩筆和上述有偏旁的編碼組成;b2)對非右偏旁的其他同構漢字,其偏碼由它的左偏旁或部首的編碼和非同構部分的前兩筆,與最後兩筆的編碼組成。若非構部編碼不足4筆,則由這部分的全部筆劃的編碼和其偏旁或部首的編碼組成。(2)對於高頻字的特殊處理引入一級、二級和三級簡碼的概念,一級簡碼就是擊一個數字鍵和空格鍵就可輸入,同理,擊二個數字鍵和空格鍵就可輸入的稱二級簡碼,並以此類推。(3)對於詞組的輸入,a)兩字詞組,鍵入每字的前兩碼,如未出現該詞時,再追加識別碼0;b)三字詞組,前兩字的首碼和末字的前兩碼,如未出現該詞時,再追加識別碼0;c)四字以上詞組,前三字與末字的首碼,如未出現該詞時,再追加識別碼。
2.按照權利要求1所述的輸入方法,其特徵在於,所賦以10個數字編碼,其對應關係排列如下筆劃編碼1-5 表1筆劃名稱 筆划走向 筆劃及其變形 筆劃編碼橫 左→右 一 1豎 上→下 丨 2撇 右上→左下 丿 3捺 左上→右下 4折 帶轉折 5選擇對重碼率影響最大的漢字部件19個,作為關鍵部件,將它們分成5類,並賦以編碼6、7、8、9、0,現作列表如下部件編碼6表2漢字部件 例字部件編碼提手旁、口旁 提、呵 6車旁、足旁、 較、跟走之、三點水 道、漢 7訁旁、釒旁語、銻女旁、子旁好、孫 8單人旁們木旁、馬旁楊、馭 9石旁、反犬旁 碼、狂蟲旁、艹頭、 蚊、草 0魚旁、糹旁鰻、經
3.按照權利要求1所述的輸入方法,其特徵在於,所歸屬的不同特徵筆劃,其對應的編碼關係為表3漢字部件 特徵筆劃 所在位置 例字 部件編碼立旁,兩點水 橫筆劃左偏旁 站、冶1立刀 刂 豎筆劃右偏旁 到其旁、耳旁豎筆劃左偏旁 斯、取2王旁、米旁珩、糧提土旁等 址火旁、矢旁丿筆劃左偏旁 燃、知文旁、赤旁斌、赫3開旁等等 形廠頭、廣頭、 丿筆劃字首 壓、度疒頭、竹頭痣、築反文、交旁捺筆劃右偏旁 放、膠4走字旁捺筆劃字尾 赴力旁、欠旁、 勁、歡鳥旁、頁旁、 折筆劃右偏旁 鴿、顏見旁、瓜旁、 視、狐戈旁、各旁、 戲、格亥旁、右雙包 賅、邦5歹旁、牙旁、 殘、邪日旁、目旁、 折筆劃左偏旁 明、眼飠旁、衤旁、 飲、補弓旁等等 粥
全文摘要
計算機漢字同構輸入法,將漢字的5類筆劃分別賦於1至5共5個數字編碼,將漢字的偏旁部首分別賦以0至9共10個數字編碼,按照漢字同構輸入方法規則進行漢字輸入,由於建立了漢字的關鍵部件、重要部件和同構漢字,以及一級、二級、三級簡碼等概念,使本方法得以易學、易記、重碼率低、錄入速率快等特點,尤其對於沒有字母鍵的手機和掌上電腦中,更顯示出獨特優越性。
文檔編號G06F3/023GK1270342SQ0010910
公開日2000年10月18日 申請日期2000年6月8日 優先權日2000年6月8日
發明者楊紹祺, 楊徵宇, 袁軍 申請人:楊紹祺

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀