漢字四筆碼及其輸入方法
2023-10-08 08:54:14 3
專利名稱:漢字四筆碼及其輸入方法
技術領域:
本發明涉及一種漢字編碼輸入方法。
隨著計算機信息處理的發展,目前已有幾百種漢字編碼輸入方法,最為典型的有五筆字型輸入法,這種輸入方法輸入速度高,但編碼規則複雜,非職業錄入人員難以掌握。
本發明的目的在於針對現有漢字編碼及其輸入方法存在的不足,提供一種聲、形結合的編碼輸入法。
本發明技術方案是根據漢字地特點,歸納成基本字、單體字、特別字、偏旁和基本筆劃作為組成漢字的基本單位,分布在英文鍵盤上,以聲碼+形碼+形碼+形碼的順序對每個字根進行編碼。(1)聲母信息
每個漢字的讀音均由聲母和韻母組成,因此聲母信息可以反映一個漢字的構字特徵,每個漢字都有一個唯一代碼與之相對應,對聲母使用除I、V、U之外的23個英文字母鍵位上。(2)形碼信息
每個漢字都有固定的偏旁,按照一定的拆字規則將漢字拆分,然後對於不成字的偏旁按照《現代漢語詞典》附錄中的標準讀法的聲母進行編碼,對於成字的偏旁由該漢字讀音聲母進行編碼,對於《現代漢語詞典》未收錄的偏旁按照表1讀法的聲母進行編碼,除上述的形碼之外,對形碼聲母使用頻度定義14個特殊規定偏旁或漢字(見表2)。所述的形碼被安排在26個英文字母鍵盤、「;」、「.」、","、"/"四個符號鍵盤上。本發明的優點1.重碼率低
按照國標漢字6763個,進行編碼,重碼為120組,僅為流行的「五筆字型」的一半不到。2.擊鍵次數少
每個漢字編碼最多擊鍵四次,其中約10%的字只需擊鍵二到三次,再加空格鍵即可。3.編碼規則簡單,無需太多死記硬背
特殊形碼記憶量僅為14個,為「五筆字型」的1/10
拆字原則按照漢字成字規律,而且無需判斷字型。4.拼音基礎要求不高
全部用拼音聲母進行編碼,Zh、Ch、Sh也歸入z、c、s省卻判斷翹舌音的麻煩,即便不懂漢字拼音,用英語拼法也可,適合港奧臺及海外華人推廣使用。5.繁體字只須稍加改動便可直接編碼
由於獨創「基本字」、「單體字」概念,本漢字輸入法同時適用繁體字直接輸入,適合全球推廣。編碼規則舉例1.聲碼+形碼+形碼+形碼,四碼全部由漢語拼音的聲母表示,例封(土+土+寸)代碼FTTC
康(廣++水)代碼KGXS
你(亻+冖+小)代碼NLTX2.形碼不足三個的,以空格補充例爾(冖+小)代碼ETX
當(小+彐)代碼DXX3.形碼超過三個的,取第一、第二、最後三個部件例慰(屍+二+心)代碼WSEX
繁(+母+小)代碼FRMX
堡(亻+口+土)代碼BLOT4.單體字拆成基本字+筆劃例白(日+丿)代碼BRP我(戈++
)代碼WGGT5.基本字直接拆成筆畫例業(丶+丿+丨)代碼YDPI6.特別規定的字不拆例;目 代碼MD
足 代碼ZE
山 代碼SF
口 代碼K0
魚 代碼YP
月 代碼YU
木 代碼M,
石 代碼S;
拆字規則1.「單體字」、「基本字」的概念 a.基本字
僅由筆劃組成,無法拆出字或偏旁的漢字稱作基本字。
例業、卜、七、工、韋、寸、長 b.單體字
只能拆出一個字或偏旁的漢字稱為單體字。例白(日+丿)方(二+
+丿)旦(日+一)2.四種情況不拆 a.單體字作為拆字的第一筆、第三筆不拆
例齒(止+人+凵)代碼CZRK
堡(亻+口+土) 代碼BLDT
注當單體字處於拆字第二筆,且此時的第二筆為拆字的最後一筆時,這個單體字要拆
例址(土+上+丨)代碼ZTSI
灶(火+十+一)代碼ZHSH b.包含在漢字中的基本字不拆
例村(木+寸)代碼C,C
鑼(釒+四+夕)代碼LJSX c.不成字偏旁不拆
例鐵(釒++大)代碼TJRD d.特別規定的14個字或偏旁不拆
例巖(山+石)代碼YF;
鮑(魚+勹+已)代碼BPGS
榜(木+二+方)代碼B,EF
胰(月+大+弓)代碼YUDG
瞪(目+癶+)代碼DDDV 3.拆字順序
①從左到右,從上到下,從外到裡。順序主線為從左上到右下。
②單體字、偏旁、基本字優先於筆劃。
例白(日+丿)代碼BRP]
眉(屍+目+丨)代碼MSDI
沈(氵+冖+)代碼MSDI
③筆劃順序
(勾)>(折)>
(提)>丶(點)>(奈)>丿(撇)>丨(豎)>一(橫)
代碼GZ TD N P I H 4.拆二原則
能拆出兩個字或偏旁的,不拆一個。
例市(二+巾) 不能拆成(幣+丶) 5.拆大原則
每次拆字須拆出筆劃數最多的字或偏旁,但此原則若與拆二原則發生矛盾時,拆二原則優先 例成(戊+口+一)代碼XWDH而不能將「戊」拆成「戈」+「丿」 6.字大於偏旁
既能拆成字又能拆成偏旁,字優先例鳥(烏+丶) 代碼NWD
而不能拆成(ㄅ++丶) 7.數字 ①小寫一、二、三、四、五、六、七、八、九、十代碼為1,2,3,4,5,6,7,8,9,10,
大寫壹、貳、叄、肆、伍、陸、柒、捌、玖、拾、零代碼為1;2;3;4;5;6;7;8;9;10;0; ②包含在漢字中的數字,仍以其發聲聲母編碼,但需注意以下情況
a.「一」一律視作筆畫「橫」
例旦(日+一)代碼;DRH
b.「二」除以下兩種情況外一律視為筆劃「橫」
(1)與別的筆劃完全分離,例仁。(2)作為字的偏旁,但不能與
其他筆劃相交叉,例雲、虧、芸。
c.「三」視作「二」+「橫」
例仨(亻+二+一)代碼SLEH
d.「十」若與其他筆劃相交叉時,視作筆畫「豎」和「橫」,其餘情況仍視為「十」,代碼S 例博、孛、早。
8.多音字
分為二種情況,(1)多音字有幾種讀音,就有幾種編碼與之對應。(2)包含在字中的多音字,採用常用字優先,若幾種讀法均為常用,按照26個英文字母排列順序,A>B>C……>Z。
9.左中右結構
分別從左、中、右結構中取出一形碼。
例糊(米+十+月)辨(二+リ+十)
辮(二+糹+十) 10.凹、凸、人、入可用簡碼AO、TU、REN、RU。
11.蠃、贏、羸、瀛、嬴以蟲、貝、羊、女為最末尾形碼。
12.第4、5、6條原則若與第3條原則發生矛盾時,第2條原則優先。
表1《現代漢語詞典》收錄的偏旁的聲母編碼表A 糹B 宀 、疒C
、廠D 灬 、刂、癶E 卩 、阝、足G 廣 、勹、H 火 、禾、I 訁J 釒 、廴、丬(爿)K 扌 、冂、匚、L 卄 、亻、冫M 皿、 米N 牜O 口P 彡Q 犭、
S 飠、 礻、 厶、彳、罒T 冖、 V 艹W 攵、 夂、
X 忄Y 衤、 尢Z 、
、辶,木。氵
表2定義14個特殊規定偏旁或漢字的編碼A糹、
D目E足、F山K扌I訁L亻O口P魚U月V艹、
, 木; 石。
氵
表3編碼匯總表A糹、
B卜、 八 、宀、疒C採、
、ナ、叉、廠、D目、 リ 、刂、
、丩、ク、マ、
癶E阝、 卩 、、足、
F山、 屮 、
主、镸、
、
G
巛、勹H、戶I訁J釒、廴、丬、爿K扌、口、
、凵、冂、匚、
、
L卄、丌、亻、冫N牜、女O口、P彡、魚、
Q犭、
乙、
RS、身、彳、礻、飠、、
水T冖、、、
U月V艹、、
W攵、夂X、
彐、西、小、穴、忄、
Y尢、衤、
Z、舟、辶、爫, 木; 石。
氵
權利要求
1.漢字四筆碼及其輸入方法,根據漢字的特點,歸納成基本字、單體字、特別字、偏旁和基本筆劃作為組成漢字的基本單位,分布在英文鍵盤上,其特徵在於a.以聲碼+形碼+形碼+形碼的順序對每個字根進行編碼;b.對聲母使用除I、V、U之外的23個英文字母鍵位上;c.所述的形碼被安排在26個英文字母鍵盤、「;」、「.」、","、"/"四個符號鍵盤上。
2.根據權利要求1所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+形碼+形碼為順序的第四碼可以是空格;
3.根據權利要求1所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+形碼+形碼為順序的第四碼可以是漢字的最後一個形碼;
4.根據權利要求1所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+形碼+形碼為順序的第四碼可以是漢字的筆劃聲碼;
5.根據權利要求2所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+形碼+空格為順序的第三碼可以是空格;
6.根據權利要求2所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+形碼+空格為順序的第三碼可以是漢字的筆劃聲碼;
7.根據權利要求5所述的漢字四筆碼及其輸入方法,其特徵在於所述的以聲碼+形碼+空格+空格為順序的第二碼可以是漢字的筆劃聲碼;
全文摘要
本發明涉及一種漢字編碼輸入方法。本發明技術方案是:根據漢字的特點,歸納成基本字、單體字、特別字、偏旁和基本筆劃作為組成漢字的基本單位,分布在英文鍵盤上,以聲碼+形碼+形碼+形碼的順序對每個字根進行編碼。本發明的優點:重碼率低,擊鍵次數少,編碼規則簡單,無需太多死記硬背,拼音基礎要求不高,繁體字只須稍加改動便可直接編碼。
文檔編號G06F3/023GK1198549SQ9711173
公開日1998年11月11日 申請日期1997年5月5日 優先權日1997年5月5日
發明者石偉 申請人:石偉