新四季網

一種漢字數碼鍵盤輸入方法

2023-08-05 02:14:21

專利名稱:一種漢字數碼鍵盤輸入方法
技術領域:
本發明屬於漢字信息處理技術,是一種漢字的數字鍵盤輸入方法,特別適用於手機、電子記事本、收款機等小型電子設備的數字小鍵盤的漢字輸入方法,當然也適用計算機上數字鍵盤的漢字輸入。
背景技術:
隨著手機、收款機等小型電子設備的迅速發展,必須配以數字小鍵盤為操作工具的漢字數碼輸入方法。現有的此類數字鍵盤輸入方法有兩種,一是漢語拼音法,二是漢字筆畫法,這兩種數碼輸入法都存在按鍵次數太多,重碼率太高,速度慢的缺點。本發明的目的在於提供一種按鍵次數更少,重碼更低,速度更快些的漢字數碼鍵盤輸入方法。

發明內容
本發明構思源自漢字字典的傳統檢字方法的偏旁部首和四角號碼法,將各有利弊的部首法和四角號碼法加以改造,取其所長融合而成的,即選擇少於100個部首和筆畫作為組成漢字的構件,並對這些構件依照他們的特徵予以歸納分類,以1、2、3……9、0等10個數碼代表這些構件。然後在配以若干條取碼規則,組成完整的漢字編碼方法。有了該編碼方法,就可依此使用電子設備的數碼鍵盤將漢字存入或取出。下面對本發明一種漢字數碼鍵盤輸入方法的具體內容做詳細說明。本發明方法包括如下步驟第一步、選定漢字組字構件。
首先深入分析漢字部首檢字法,研究如何將漢字二次查找變成一次查找。漢字部首檢索法就是先查部首再查這個部首中的漢字,我們叫二次查找法,而不能象查英文字典那樣一次查找,如果我們要實現漢字的一次查找就要研究二個問題。一是漢字部首的數量問題,現在新華字典的部首為189個,權威的康熙字典為214個,古老的《說文解字》有540個部首。這說明隨著文明的發展,漢字的部首是在減少的,但減少的速度是非常緩慢的,正如有些專家說的,要使部首減少到100個以內就是很大的成功。二是漢字部首的位置問題。人們在經常查字典中發現,絕大部分的部首都在字的左邊、上方、左上方或外框上,這類字要佔九成以上,同時有少數字其部首所在位置不定,上下、左右、內外都有,因此有些字是很難查到的。能否對這些字的部首也限制在字的左方、上方、左上方或外框上,這就是我們所說的部首統一原則。以上兩個問題統一起來,就是如何選擇部首了。研究表明,部首個數多少,與重碼率密切相關,部首個數少,重碼率會上升。依照上述幾個原則,一個最佳方案是選用88個部首,使重碼字最多不超過8個字。
為了與傳統漢字部首相區別,我們把篩選確定的88個筆形不叫部首而是統一稱為構件。這些構件既要符合傳統部首的要求,能夠將所有的漢字包括繁體字都能夠表達出來,又要符合漢字簡化後的要求,如簡化後引進的多折筆形都是一筆畫;這些構件既是標準漢字的科學拆分,如要求對所有漢字的部首唯一,沒有二義性;更要貫徹漢字交重筆畫不能拆分的原則。為此在88個構件中,引進「叉」和「串」兩類筆形,可以表達所有含有交重筆畫的交重字。這88個構件可以分為三類筆形,一是基本筆畫,包括橫(一)、提 撇(丿)、豎(丨)、鉤(亅)、點(丶)和捺()共7個,可以看出,與原有的傳統基本筆畫相比,只是去掉折(乙、 乚)而加進了鉤(亅)。二是簡碼字26個,原為部首字有一、水、巾、田、十、口、目、皿、日、曰、廠、又、八、人(入)、卜、小、心、幾、月、金共20個,另有七、豐、丈、卅、匕、的共6個,這是新華字典上部首字中所沒有的。我們之所以把「的」字定為簡碼,是因為在漢字應用中出現「的」字頻率最大。三是餘下的55個為複合筆畫,有的是作為簡碼字的變形,有的是作為數字碼的象形而引進的。這88個漢字構件的筆形與代碼如下表所示。
這些漢字構件及其代碼的主要內容可以用四句口訣來表述一橫二垂三點水,四叉五串六方框,七角八八九頭小,零幾雙角月皿金。而這四句口訣中的核心內容又是「一橫、二垂、三點、四叉、五串、六方、七角、八八、九小、零雙角」。從這88個構件在漢字中出現的頻率來看,這一核心內容(即「一橫、二垂、三點、四叉、五串、六方、七角、八八、九小、零雙角」)已佔絕大部分。顯然這一核心內容是十分便於學習和記憶的。
第二步、按照下述的一定取碼規則,對國家標準GB/T18031-2000《信息技術數字鍵盤漢字輸入通用要求》的《信息交換用漢字編碼字符的基本集》的6763個漢字(其中部首46個)逐一進行編碼,每個漢字有一組唯一由1-4位數組成的數碼。結果顯示這6763個漢字的數碼完全不同的佔39%,重碼最多不超過8個字,從而做到在手機顯示屏上不必翻頁。
第三步、依照上述每個漢字的編定的數碼,對電腦漢字庫內的漢字進行編碼,即對每個漢字的編碼數字在電腦鍵盤上的1、2、3……9、0等10個數字鍵的對應鍵上擊鍵一次,將每個漢字的數字編碼存入電腦內,建立漢字數碼信息庫,如需檢索漢字時,只需在電腦漢字作業系統下,將該漢字的數碼鍵入,就可取出所查的漢字。這就是本發明方法的全過程。
前面所說的取碼規則包括1、取碼總則。它可用四句口訣表述左上取碼順時轉,最多只取四個碼,筆畫交重不拆分,連離可分要取大。即每個字都從左上角開始取第一碼,然後按順時針方向旋轉依次取第二、第三、第四碼,而且最多只取四個碼。至於第二、三、四碼具體在何處取,要依不同字體結構而定。取碼遇到交重筆畫時,不能把他們拆分開來,要看成整體來進行取碼。例如「弋」取43,「戈」取53,是對號入座。對於那些表面分離的而內在有聯繫的筆畫,要儘可能把它看成整體進行取碼,例如「屍」取62而不能取別的碼,「尺」應取為68而不能取632。
2、取碼「序位」規則。漢字是方塊字,依其不同結構可以分為左右結構;左中右結構;上下和上中下結構;包圍結構;混合結構。不同結構類型的字,雖然其第一碼都必須從左上角取碼,而且按順時針方向轉位,但其具體「序位」卻是不同的,其規則是(1)左右結構的取碼序位是左上角→右上角→右下角→左下角。例如「旋」取9887;「轉」取4535;「但」取861;「明」取60。
必須強調,當左右結構漢字中含有「冂、門、 戊」時,對「冂、門、 戊」內的部件都要優先取碼。例如;「禍」應取3608不能取3602;「燜」取9309不能取9308;「颯」取9041;「城」取4537。
(2)左中右結構的取碼序位是左上→中上→右上→右下,例如「鴻」取3123;「衍」取2312;「班」取1211;「收」取7284;「師」取214。
左右(包括左中右)結構約佔漢字總數的80%,可見以上兩種序位規則佔大多數情況。
(3)上下或上中下結構的取碼序位是上方→下方→再自下而上(必要輔以自左至右)取足四碼。例如「節」取59;「支」取47;「善」取8619;「兔」取2043;「五」取1147;「美」取8841;「羅」取6723。
必須特別指出,當上下結構或上中下結構漢字中含有「八、大、人、乂、又」時,如「叄」取0118;「參」取0228;「冬」取2373;「祭」取2791;「薟」取5198;「爸」取8062;「蠶」取1315;「賽」取3808;「驀」取5317;「譽」取9611等字,從下方自下而上取碼時,在「八、大、人、乂、又」下最多只涵蓋一個基本筆畫,其他筆畫都要依次先取。
(4)冂、門、 戊、囗等包圍結構字形的取碼序位是先取上方和外框碼→再進入框內,在框內右下部取碼→再按順時針方向自右至左或者自下至上,取足四碼。例如「閂」取301;「闊」取3063;「閩」取3031;「閫」取3069;「圃」取6053;「園」取6021;「四」取672;「岡」取04;「網」044;「凰」取0141;「夙」0723;「鹹」取5362;「成」取5372。
3、在字的上方或下方取碼時,若有數個獨立筆畫可取,則要比高低而定上部高者優先,下部低者優先。字上部的點「丶」畫也屬優先取碼之列。例如字上部的「 夊、 夕、勹、山」都應當取「2」。又如「義」取34;「為」取3473;「書」取5377。再如字中有如「石、 勿、者」構成的字「柘」取4169;碭取1326;「竣」取9071;「履」取6782;「忽」取2927;「堵」取4461。
4、對字上下部難以區分高低的獨立部件都要取。如朱、監、彖、羋、長、叟、兜、盥等字的上部的獨立部件都是要取的。字下部如「乖」取2043;「弟」取8352;「姊」取4532;「韓」取4574;「岈」2142;「財」取0428。
5、交重筆畫取碼規則。對於交重筆畫的取碼,除了在總則中所講的「不拆分」以外,還應當遵從如下細則(1)由橫、提、撇、豎、鉤、點、捺等基本筆畫組成交重筆畫時,可以多次「取碼」,即可看成某一長筆畫由若干段連接而成的。例如「夫、未、末、來、夾」等字其上部都要取串5,其下部就只能分別以「八、個、個、個、八」來取碼了。中間還可對 取碼,這裡把「丿」、「丨」看成上、下二段,或上中下三段,上段構成「串」的組成筆畫,下段構成「八、個」的組成筆畫,中段組成 的筆畫。簡而言之,就是上、下取了二次或上中下三次。
(2)如果被交重的筆畫不是基本筆畫,則只能取一次而不得取二次。例如「沛、芾、肺、制」等字中,直「丨」的被串筆畫中含有「冂」,這是非基本筆畫,因而對這些字取碼時「丨」不能分為上、下二段,即不能取上、下二次,所以當上部取了「串5」以後下部留下的是「冂」,而不是「巾」。又如「央、英」只能取580、5850。再如「冉」字拆為「、艹、冂」取550。
(3)若字中插串的筆畫不是基本筆畫,那麼它所形成的「角」是應當被取碼的。例如「戔、東」字中,插串的筆畫是 它不是基本筆畫,依前條規則,它不能折成二段,只能取一次碼。但本條又規定,它自身形成的「角」將被取碼。可見在這些字中的筆畫 在取碼過程中,實際上被用了二次。故「戔」取537;「東」取4947。
本發明方法具有下述優點構件數量少,特徵明確,不易混淆,分布均勻;遵從漢字傳統習慣,符合國家標準,尤其引入叉和串兩類構件,實行「交重不拆」原則,確保首碼唯一;每個漢字的碼數有多有少,最多4碼,這就是充分利用漢字信息,而且減少了重碼,一碼一字佔39%,重碼字最多的也不超過8個,因而在手機顯示屏上不必翻頁;全部內容集中反映在8句口訣中,易學易記,易於推廣應用。
本發明方法對更多數量的漢字集如中日韓國際標準字集共有20902個漢字(GB13000),同樣可以使用,只是重碼字會略有增多。
權利要求
1.一種漢字數碼鍵盤輸入方法,其特徵是有如下步驟(1)篩選確定如下表所列的88個筆形作為組成漢字的構件,並按照這些構件的特徵,歸納分為10類,分別以1、2、3、4……9、0等10個數字予以代表,漢字構件及其代碼的主要內容可以用四句口訣來表述一橫二垂三點水、四叉五串六方框、七角八八九頭小、零幾雙角月皿金;漢字數碼的筆形與代碼表 (2)依照下述取碼規則,遵循國家標準GB/T18031-2000《信息技術數字鍵盤漢字輸入通用要求》,對《信息交換用漢字編碼字符的基本集》(GB2312-80)的6763個漢字(其中部首46個)逐一進行編碼,每個漢字有一組唯一的由1-4位數組成的數碼;(3)依照上述每個漢字的編定的數碼,對電腦漢字庫內的漢字進行編碼,即對每個漢字的編碼數字在電腦鍵盤上的1、2、3……9、0等10個數字鍵的對應鍵上擊鍵一次,將每個漢字的數字編碼存入電腦內,建立漢字數碼信息庫,如需檢索漢字時,只需在電腦漢字作業系統下,將該漢字的數碼鍵入,就可取出所查的漢字;所說的取碼規則,有以下幾條(1)取碼總則也可以用四句口訣表述——左上取碼順時轉、最多只取四個碼、筆畫交重不拆分、連離可分要取大;(2)取碼「序位」規則,依漢字結構而定,即左右結構字為左上角→右上角→右下角→左下角;左中右結構漢字為左上→中上→右上→右下;上下或上中下結構漢字為上方→下方→再自下至上(必要時再輔以自左至右)取足四碼;門、冂、 戊、口等包圍或半包圍結構漢字為先取上方和外框→再從右下角進入框內依順時針方向自右至左或自下至上取足四碼;(3)對交重筆畫的取碼,除總則「不拆分」以外,還應遵從以下細則由橫、提、撇、豎、鉤、點、捺等基本筆畫組成的交重筆畫,可以多次取碼;如果被交重的筆畫不屬於基本筆畫,則不得多次取碼;如果字中交重的筆畫不是基本筆畫,那麼它形成的「角」應當按順序取碼;(4)在字上方或下方取碼時,若有數個獨立筆畫可取時,要比高低而定,上方時取最高者,下方時取最低者;字上下方難以區分高低的獨立筆畫都要取碼;字上方、左、右角的點畫「、」應當優先取碼。
全文摘要
本發明提供一種以10個數字鍵盤為操作工具的漢字輸入方法,特別適用於手機、收款機等小型電子設備的漢字信息處理,當然也適用於一般電腦。該方法的核心內容,可以用8句口訣來表達「一橫二垂三點水,四叉五串六方框,七角八八九頭小,零幾雙角月皿金」;「左上取碼順時轉,最多只取四個碼,筆畫交重不拆分,連離可分要取大。」本方法具有構件數量少、擊鍵次數少、重碼率低;構件特徵明顯、不易混淆、首碼唯一、分布均勻;遵從漢字傳統習慣,符合國家標準,取碼規則簡單,易學易記,便於推廣等優點。
文檔編號H04M1/23GK1525296SQ20041001658
公開日2004年9月1日 申請日期2004年2月24日 優先權日2003年3月1日
發明者譚國政 申請人:譚國政, 譚文武

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀