新四季網

字母漢字輸入法的製作方法

2023-07-25 16:24:01

專利名稱:字母漢字輸入法的製作方法
技術領域:
本發明涉及的是一種計算機漢字輸入法,具體地講,本發明涉及的是一種將漢字字母化並使其適合於計算機應用的字母漢字輸入法。
再來看一下我們的漢字,許慎在說文解字裡把漢字的造字方法歸納為六種一、指事,二、象形,三、形聲,四、會意,五、轉注,六、假借,據統計,現代漢字中形聲字佔的比重最大,在百分之八十以上,其餘五種僅佔百分之十左右,也就是說形聲字是漢字的主要組成部分,它的特點就基本上代表著漢字的主要特徵。
所謂形聲字就是一半表形、一半表聲的漢字,形就是這個字所指的事物的大體樣子或意思,聲則是這個字的讀音,比如;「鯉魚」的「鯉」字,其中「魚」是它的形,表示它是一種魚類,「裡」則是它的聲,表示「鯉」的發音為「li」,如果我們對形聲字的造字原理換一種方式表示,即直接用音節來表示它的形與聲會有什麼效果呢?這樣「鯉」便表示為魚(yu)+裡(li)=yuli的樣子,假設我們把這四個字母看成一個字,也是未嘗不可的,由於我們的目的是把漢字轉化成一種表音的文字,所以為了讀音上的方便,我們把「形」放在聲的後面,另外「形」是作為漢字所指事物的大體形狀或意思而存在的,實際上沒有標有讀音的必要,只要我們比較一下「鯉」、「狸」、「理」三字,就會發現三個同音的形聲字,之所以音同字不同,乃是因其「形」不同的緣故,由此可見」形」客觀上起的作用實際上就是區別,同音不同義的漢字間的符號而已,同時也為了字母漢字的字體不致太過臃腫,本發明的研究人員把表形部分音節的韻母省略,即「鯉」表示為「liy」,按此造字原理得出的漢字字母化辦法就可表示成這樣一個公式形聲字=「聲」的注音十「形」的注音聲母=字母漢字由形聲字的原理可知,公式中的「聲」的注音實際上就是形聲字的注音,而所有的漢字都是有注音的,所以我們不用擔心出現沒有沒「聲」的漢字,倒是「形」有些麻煩,咋看之下似乎形聲字才有,但是我們已把「形」推廣演繹為區別同音不同義的漢字間的符號(以下我們便把「形」稱作形符)。
其次,再將漢字進一步分解便會發現,所有的漢字都是由筆劃組成的,只要我們給漢字筆划進行字母定義,不是形聲字要找一個獨善其身的符號,也是不難的,就此而言這個公式完全可以推行到所有漢字中去,則該公式便可表示為方塊漢字=注音十形符=字母漢字現在的普通話基本上代表著北方的語音體系,但我國地域遼闊,各地的普通話有相當的出入,其中有兩方面表現的較為普遍一是聲調掌握不準、二是捲舌音和平舌音分不清楚。
在本發明的字母漢字中暫不設置聲調與平、捲舌音的標法,雖然這樣可能導致發音不準確,但是由於採用了形符確定一個字形,所以這方面的缺憾是可以彌補的,因此,這樣也有利於推廣。
另外,現有「漢語拼音方案」是繁瑣的,比如「晃」注音的「huang」字母有五個之多,若要對其實行字母化則需再加上形符,那麼它的字母漢字便會達到六個甚至更多,這樣就增加了書寫負擔。
因此,在易於接受和掌握的前提下,對漢語拼音方案做一下改動也是有必要的。至於形符,在輸入漢字的過程中實際上是決定輸入效率的一個重要因素,由於漢字的同音字太多,有時一個形符不能確定一個漢字,而用兩個形符是基本可以的,所以為了避免出現太多的音同形同字,我們以兩個形符為輸入的標準,當然有些字是一個形符甚至不用形符也能確定,兩個形符對它們來講是形同蛇足的,像這類情況在我們輸字時認識到後,只要把不必要的形符捨去,便是其字母化後的真身了。
為實現上述目的,本發明採取的技術方案如下一種漢字字母化並使其適合於計算機應用的字母漢字輸入法,其特徵在於所述的漢字字母化按照如下規則形聲字=「聲」的注音十「形」的注音聲母=字母漢字;或者,方塊漢字=注音十形符=字母漢字。
(一)注音規則(1)、以字母「v」代替聲母「n」;(2)、聲母「zh」「ch」「sh」一律去掉」h」,直接寫作「z」「c」「s」;(3)、將韻母「ang、eng、ong、ing」改成以其首字母雙寫的形式代替其本身;(4)、韻母 的表示方法包括(5)、當 單獨處於聲母「n」「l」之後時,其以雙寫的「u」表示;(6)、當 與「n」、「l」搭配時 上的兩點省略表示為「ue」;(7)、除上面A、B兩種情況外 的表示方法都同於原漢語拼音方案。
對按照上述1、2兩條內容改後仍超過兩個字母的韻母做精簡處理(8)、將韻母「ian、iaa(iang)、ioo(iong)」中的「i」換做「n」然後再取其改後首尾字母代替其本身;(9)、將韻母「uan 、uai、uaa(uang)」中的字母「u或 換做「o」然後再取其首尾字母代替其本身;(10)、「er」改做「ea」即er=ea;(11)、「uo」直接以「o」表示,即uo=o;(12)、a、e兩字母單獨做注音,後面須墜以字母「u」做定音符即;(13)、o、ac、ai、an、aa(ang)、ei、en、ee(eng),ou九個韻母單獨做注音時後面須墜以「e」做定音符;(14)、ea(er)不需加定音符;(15)、所涉及的二十六個拉丁字母中的a、o、e、i、u、n」六個為韻母專用字母,其餘的二十個則是聲母專用字母。
(二)形符規則1、漢字筆化的字母定義所述的筆劃分為八種,一般的以筆劃俗名注音的聲母做它們的定義字母「橫」的注音為「hee(heng)」則字母定義為「h」;「豎」的注音為「su(shu)」則字母定義為「s」;「撇」的注音為「pie」則字母定義為「p」;「捺」的注音為「va(na)」則字母定義為「v」;「點」的注音為「dn(dian)」則字母定義為「d」;「提」的注音為「ti」則字母定義為「t」;「鉤」的注音為「gou」則字母定義為「g」;「彎」的注音為「wan」則字母定義為「w」;
2、部首(形符的又一稱謂)A漢字變形類這類部首一般是可單獨使用的漢字的變形體。對於它們,我們一律視其同等於原漢字,字母定義即取原漢字的聲母。
B、俗稱類這類非字型的部首一般有較廣泛的稱呼,它們的字母定義為其稱呼首字的聲母;C、純筆化類這類非字型部首一般指既無字樣,又沒有廣泛稱呼的一類,它們的字母定義,以其首筆劃定義字母為準;3、漢字筆劃間的關係包括相離、相連、相交;4、無部首字與有部首字,將不可分的漢字稱做無部首字,將可分的漢字稱做有部首字,並把有部首字歸納為上下、左右、內外三種結構;5、無部首字形符的確定對無部首字的兩個輸字形符,我們採用砍頭、去尾、首末筆法三步確定;6、有部首字形符的確定,將可以二分的漢字稱做有部首字。
一、注音規則(對漢字拼音方案的改動)在對漢語拼音方案改動以前,讓我們先來看一下「她」、「彈」二字按照字母化公式得出的結果方塊漢字=注音十形符 =字母漢字她=ta+n(「女」字的注者聲母) =tan彈=tan+g(「弓」字的注音聲母)=tang顯然以上二字字母化後,會很容易讓我們誤以為是「探」、「湯」二字沒有聲調的注音,這種由巧合而造成的歧讀現象,說到底是因為漢語拼音方案中,聲母字母與韻母字母之間沒有嚴格分別的結果,即由於「n」、「g」二字母不但做聲母使用,而且也客竄著韻母的角色,當然這是站在我們字母化的立場上,但這種語音混淆難分的情況,是絕對不利與字母漢字的形成的,所以對漢語拼音方案的改動便由此而始。
1、規範聲母用字母與韻母用字母A,以字母「v」代替聲母「n」即「難」字注音需寫作「van」B,聲母「zh」「ch」「sh」一律去掉」h」,直接寫作「z」「c」「s」C、將韻母「ang、eng、ong、ing」改成以其首字母雙寫的形式代替其本身,
即ang=aa eng=ee ong=oo ing=ii2、韻母 的表示方法A當 單獨處於聲母「n」「l」之後時,其以雙寫的「u」表示,即 =nuu =luuB、當 與「n」、「l」搭配時 上的兩點省略表示為「ue」即 =nue =lueC、除上面A、B兩種情況外 的表示方法都同於原漢語拼音方案。
3、對按照上述1、2兩條內容改後仍超過兩個字母的韻母做精簡處理A、將韻母「ian、iaa(iang)、ioo(iong)」中的「i」換做「n」然後再取其改後首尾字母代替其本身。即ian=nan=nn iang=iaa=naa=na iong=ioo=noo=no但韻母「iao」中的「i」不在換直接將其首尾字母取出代留其本身,即iao=io由於手寫體「nn(ian)」連筆以後很容易被誤做聲母「m」因而我們便用單個的字母「n」表示「ian」即ian=nn=nB、將韻母「uan 、uai、uaa(uang)」中的字母「u或 換做「o」然後再取其首尾字母代替其本身,uan=oan=on Uai=oai=oi uaa=oaa=oa4、「er」改做「ea」即er=ea5、「uo」直接以「o」表示,即uo=o6.定音符由於部分漢字擁有純韻母的注音,如祆(ao)、藕(ou)等,而漢字在使用時多數以雙字詞或多字詞的形式存於句子中表達意思,為了讓大腦通過視覺快速反應詞句的內容,我們在書寫字母漢字時需要讓兩字或多字的詞連體出現,為了避免誤讀,要給無聲母的純韻母音節加定音符。
A、a、e兩字母單獨做注音,後面須墜以字母「u」做定音符即「阿」的注音為「au」「惡」的注音為「eu」B、o、ao、ai、an、aa(ang)、ei、en、ee(eng),ou九個韻母單獨做注音時後面須墜以「e」做定音符即「襖」的注音為「aoe」;「愛」的注音為一aie」;「喔」的注音為「oe」;「恩」的注音為「ene」。
C、ea(er)不需加定音符至此,我們對漢語拼音方案所做的改變基本結束,在改動的幅度上是比較大的,但我們有簡單明了的改動規則,只要順著改動的思路去記應該是很容易掌握的,在改動後,二十六個拉丁字母中回a、o、e、i、u、n」六個便成了韻母專用字母,其餘的二十個則是聲母專用字母,這樣便不會出現開頭那種「她」、「彈」、變「探」、「湯」的錯誤,這種截然分明的效果直接作用到讀音上,讓我們對任何字識讀起來都有一種「綽綽然有餘裕哉」的感覺。
二、形符規則1、漢字筆化的字母定義由於構成漢字的最基本單位是筆劃,所以我們首先對筆化進行字母定義,我們把筆劃分為八種,一般的以筆劃俗名注音的聲母做它們的定義字母即「一」俗名為「橫」其注音為「hee(heng)」則字母定義為「h」「丨」俗名為「豎」其注音為「su(shu)」則字母定義為「s」「丿」俗名為「撇」其注音為「pie」則字母定義為「p」「_」俗名為「捺」其注音為「va(na)」則字母定義為「v」「丶」俗名為「點」其注音為「dn(dian)」則字母定義為「d」 俗名為「提」其注音為「ti」則字母定義為「t」「亅、、」我們把這種由上向下豎向起折的筆劃稱為「鉤」其注音為「gou」則字母定義為「g」;乙」我們把這種由左向右、橫向起折的筆劃稱為「彎」其注音為「wan」則字母定義為「w」。
2、部首(形符的又一稱謂)漢字中,形聲字的比例在百分之八十以上,這個數字不禁令人有此一問為什麼形聲字的字量這樣多呢?讓我們先看幾組形聲字A松、柏、楊、梅等形為「木」表示它們為樹木B、雞、鴨、鵝、鷹等形為「鳥」表示它們為鳥類C、鯉、鰱,鯽、娼等形為「魚」表示它們為魚類D、外鋼、鐵、銅、銀等形為「金」表示它們為金屬E、貓,狗、豬、猴等形為「犭」表示它們為獸類此類多字同形的例子在漢字中不勝枚舉,由此可見自然界裡這種花草樹木、飛禽走獸乃至所有萬物各以類分的現象,為形聲字的取形提供了極大的方便,這也許是形聲字在漢字中一枝獨秀的重要原因,而形聲字的這一特點,也使得它的形極具規律性,並且早就在字典的部首查字法中得到利用,我們剛才提到的「木、鳥、魚、釒、犭、」在部首查字法中就被稱做部首,部首也可以說是形聲字的形符集合,有了這層認識我們取形就方便了,因為部首查字法是我們在小學就練就的本領。找漢字的部首應是駕輕就熟的。當然,我們在對漢字字母化時,形符要表示成字母,形符既與部首劃等號,那麼就需要索取部首的字母,這對於是字的部首來說很簡單。但是漢字從甲骨文發展到簡化字,許多本能單獨做字使用的部首,已變的不倫不類,象「忄」、「訁」、「氵」等,雖能表達出形的意思,然若單獨來看就根本稱不上字了。所以給這些非字型的部首進行字母定義是我們遇到的又一個問題。在解決的辦法上,我們把非字型的部首分成三類,即漢字變形類,俗稱類,純筆劃類各自來說。需要注意的是我們視單筆劃橫、豎、撇、捺等不為部首A漢字變形類這類部首一般是可單獨使用的漢字的變形體。對於它們,我們一律視其同等於原漢字,字母定義即取原漢字的聲母。
例如「釒」為「金」的變形體 字母定義為「金」的聲母「j」「亻」為「人」的變形體 字母定義為「人」的聲母「r」「攵」為「文」的變形體 字母定義為「文」的聲母「w」 為「刀」的變形體 字母定義為「刀」的聲母「d」「訁」為「言」的變形體 字母定義為「言」的聲母「y」(其餘詳見附表)B、俗稱類這類非字型的部首一般有較廣泛的稱呼,它們的字母定義為其稱呼首字的聲母例如「疒」俗稱「病率框」稱呼首字為「病」則其字母定義為「b」「_」俗稱「虎字頭」稱呼首字為「虎」則其字母定義為「h」「宀」俗稱「蓋」稱呼首字為「蓋」則其字母定義為「g」「糹」俗稱「絞絲」稱呼首字為「絞」則其字母定義為「j」另外為了減少音同形同字,我們把非字型部首「艹」與字型部首「木」重新改名歸入此類中進行字母定義「艹」取名為「芳草頭」稱呼首字為「芳」則其字母定義為「f」「木」取名為「林木旁」稱呼首字為「林」則其字母定義為「l」(其餘詳見附表)C、純筆化類這類非字型部首一般指既無字樣,又沒有廣泛稱呼的一類,它們的字母定義,以其首筆劃定義字母為準
例如「巳」首筆劃為 稱做「彎」字母定義為「w」 首筆劃為「一」稱做「橫」字母定義為「h」「勹」首筆劃為 稱做「撇」字母定義為「p」「髟」首筆劃為「一」稱做「橫」字母定義為「h」同樣為減少同音同形字,我們把「氵」三點水旁,「阝」左、右耳旁,歸入此類中進行字母定義「氵」首筆為 字母定義為「d」「阝」首筆為 字母定義為「W」另外對注音無聲母的部首也歸入此類字母定義i「兒」注音無聲母,首筆劃為「丿」撇字母定義為「p」「耳」注音無聲母,首筆劃為「一」橫字母定義為「h」其次一些古字部首如 「彳」「巛」「彡」等也歸入此中進行字母定義 首筆為 定義字母為「g」「彳」首筆為 定義字母為「p」「巛」首筆為 定義字母為「g」「彡」首筆為 定義字母為「p」(其餘詳見附表)3、刪除掉的幾個部首由於在本方案的實際操作當中,傳統上列入部首的部分筆劃結構,失去了其作為部首存在的意義,所以我們把其刪除,被刪除的有下列幾個「二」、 「採」、「攴」、「疋」、「屮」、「肀」、 「亠」 4、漢字筆劃間的關係A、相離二、小筆劃與筆劃間有一定的空間距離;B、相連弓、工一筆與另一筆連接在一起但不侵入對方;C、相交韋、 一筆與另一筆交叉相互切割;5、無部首字與有部首字形聲字定義為,一半表形、一半表聲的漢字,從這個概念上看形聲字應是由兩個字組成的,即表形的是一個字,表聲的也是一個字,之所以這樣說是因為只有字才能表示事物的形狀或意思,只有字才會有讀音,但是我們在部首的情況中了解到,許多形聲字的形在漫長的歷史演化過程中,已變的不能單獨做字使用了,因此、從嚴格意義上來講,把形聲字理解為是有兩個字組成的就不確切了,但是說形聲字是由表形與表聲的兩部分組成的還是可以的,由於絕大部分的漢字是形聲字,所以由形聲字的概念,我們可以得出這樣一個結論大部分的漢字是可以一分為二的,也就是說漢字的結構大多為二元性。為了便於分析確定形符,我們對所有的漢字都進行二分。但有不可分與可分之別,所謂不可分是指二分的兩部分有筆劃相交時不分。或二分的兩部分中,一部的筆劃深入另一部分,並與另一部分的筆劃相連時不分,另外分出的兩部分若都不含有字也不分。簡潔的說出來就是相交不分,深入相連不分,分不出字來不分,反之便為可分,在進行二分時我們視含在漢字中的數字「一」「二」「三」為純粹的筆劃不為字,但視非字形的部首同等於漢字,並優先讓它們佔據二份中的一份。其次,字中若沒有非字型部首,我們便讓字型部首字優先佔據一份。另外,一個字中若出現多個非字型部首或多個字型部首時則以先寫出的為準。但能分時,我們以可分成兩個字為最佳的分法,當筆劃連接為一體的漢字,可以分出一字卻有多種分法時,我們以可分出部首為準,可分出多個部首,則以先寫出的為準。其次,我們把不可分的漢字稱做無部首字。可分的漢字稱做有部首字,並把有部首字歸納為上下、左右、內外三種結構A無部首字例如「事」末筆劃貫穿上下,相交不分為無部首字;「冊」本筆劃橫穿左右,相交不分為無部首字;「木」上部筆劃「丨」深入下部「八」中並與其筆劃相連而不分,為無部首字;「且」下部筆劃 深入上部。 中並與其筆劃相連而不可分成上 下「三」樣子,故為無部首字;「裡」上下兩部被其豎筆交連為一體不可分為無部首字;「麗」分不出字來不分為無部首字;「兒」分不出字來不分為無部首字;「三」可分成上「一」下「二」的兩部分,但我們視「一」、「二」不為字,所以亦分不出字來不分為無部首字B、有部首字例如上下型「冒」上為「曰」下為「目」為有部首字「哭」上為 下為「犬」為有部首字「品」上為「口」下為 為有部首字「幕」上為「莫」下為「巾」為有部首字,如果讓非字型部首「艹」優先佔據一部,分成上「艹」下 的樣子便會使下部總起來不是字,從而達不到兩分皆字的最佳效果,故不取。
「坐」上為「從」下為「土」為有部首字,按國家、規定的標準字體(字典亦可證實)「坐」字上部的兩個「人」是不與下部相連的,所以其下部「土」字的「丨」筆雖深入上部亦可分;「天」上為「一」下為「大」能分出「大」字,為有部首字,咋看起來,「天」也可分成「二」與「人」的樣子,但這樣上下兩部筆劃相交,故不取;「蟲」上為「中」下為「一」能分出「中」字,為有部首字,「嚴」上為 下為「廠」能分出「廠」字,為有部首字,看上去「嚴」也可分成上「亞」下「丿」的樣子,但「亞」不為傳統意義上的部首,故不取;「產」上為「立」下為「丿」為有部首字,其實「產,』分做上 下「廠」也是可分出部首的,但「立」為先寫出的部首,故不取後者;「頁」上為「丆」下為「貝」為有部首字,「頁」字與「產」字情況相同,因而我們亦不取上 下「人」的分法。
左右型「林」左為「木」,右為「木」為有部首字、「惻」左為「·卜,右為「則」為有部首字、「倒」左為「亻」,右為「到」為有部首字、「倒」字分成左「侄」右「刂」也有兩分皆字的效果,但非字型部首「亻」較「刂」先寫出所以我們不取後者。
「彬」左為「林」右為「彡」為有部首字,「彬」分做左「木」右「杉」也是分做兩個字。但我們優先讓非字型的部首「彡」佔據兩部分中的一部分,故取前者。
「成」左為 右為「戈」可分出「戈」字為部首。
內外型「田」外為「口」內為「十」為有部首字「圍」外為「口」內為「韋」為有部首字「匍」外為「勺」內為「甫」為有部首字「遠」外為「辶」內為「元」為有部首字,對這種一部分被另一部分半包圍的字,我們亦視其為內外結構。
「栽」外為 內為「木」為有部首字,「木」為 半包圍「裹」外為「衣」內為「果」為有部首字,對這種一部被拆開的一字夾在中間的情況,我們也視其為內外結構,這時其內部筆劃與外部筆劃須呈相離狀態。
「衍」外為「行」內為「氵」為有部首字,「行」字拆開夾住「氵」「辮」外為 內為「糹」為有部首字,對這種由相同的字夾住一部的情況,我們亦視其為內外結構,這時其內外部筆劃亦須呈相離狀態。
「斑」外為 內為「文」為有部首字,「文」被 夾「器」外為 內為「犬」為有部首字,「犬」被 夾「為」外為 內為「力」為有部首字,對這種去掉點筆,可成一字的情況我們亦被其為內外結構,並以點為外部結構,「玉」外為 內為「王」為有部首字、「辦」外為 內為「力」為有部首字、6.無部首字形符的確定對無部首字的兩個輸字形符,我們採用砍頭、去尾、首末筆法三步確定,即當去掉無部首字的首筆劃,可另成一個能單獨使用的漢字時,我們便以所成字(該字不為古僻字)的聲母做原字的第一個形符,以去掉的首筆劃的定義字母做它的第二個形符。此便為砍頭,當砍頭不是字母時,我們便再用「去尾」,即去掉無部首字的末筆可另成一單獨使用的漢字時,我們便以所成字(該字仍不為古僻字)的聲母做原字的第一個形符,以去掉的末筆劃的定義字母做它的第二個形符。當無部首字「砍頭」,「去尾」都不能另成字時,我們便以它的首求兩筆劃做形符,即以首筆劃的定義字母做它的第一個形符,以末筆劃的定義字母做它的第二個形符,單筆劃的漢字則將其筆劃定義字母雙寫。例如「夫」無部首字,去首筆可成字「大」則其第一個形符為「d」第二個形符為首筆劃「一」的定義字母「h」,和起來便為「dh」,那麼「夫」便可字母化為「fudh」。
「世」無部首字,去首筆不成字,但去尾筆可成字「廿」則其第一個形符「v」第二個形符為末筆劃 的定義字母「g」,那麼「世」便字母化為「sivg。
「木」無部首字,去首、尾筆都不成字,則其第一個形符便為它的首筆劃「一」的定義字母「h」,第二個形符便為它的末筆劃「_」的定義字母「v」那麼「木」便字母化為「muhv」。
「乙」無部首字,單筆劃漢字,則其兩個形符為它筆劃「乙」的定義字母雙寫,是為「ww」那麼「乙」便字母化為「yiww」。
7.有部首字形符的確定本類字的形符,一般由部首決定,所以先要說一下取部首的辦法,我們把可以二分的漢字稱做有部首字,目的是為了便於確定一個取部首的統一規則,但實際的應用當中,大部分的漢字,一部分與另一部分間,呈現出的是一目了然的相離狀態,除少部分的連體字及多部首字外,並用不著對其進行刻意的二分,所以在一般情況下,直接尋部首便是,為了快速準確的提取部首,我們歸納了以下幾種辦法。
A①整取法即所取部首,儘量能完全佔字的一個縱部結構。例如
「哭」取完全佔有其下部結構的「犬」做部首,不取「口」「聶」取完全佔有其上部結構的「耳」做部首,不取「又」「沿」取完全佔有其左部結構的「氵」做部首,不敢「幾」或「口」「載」取完全佔有其內部結構的「車」做部首,不取「十」或「戈」「辯」取完全佔有其內部結構的「訁」做部首,不取「辛」,部首「辛」只佔其外部結構 中的一半。
②餘字法就是取出部首後,餘下的部分能做漢字單獨使用。此法一般用在整取法不能確定部首時,這時漢字一般有多個部首,且都能整取,例如「則」左右都是部首,且都能整改,但取「刂」可餘漢字「貝」,便取「刂」做部首,「匡」內外都是部首,且都能整取,但取「匚」可餘漢字「王」,便取「匚」做部首「幕」取「巾」做部首,可餘漢字「莫」,但取「艹」所餘 非漢字,所以取「巾」做部首。
③分類法就是先取非字型部首,再取字型部首,這是字的多個部首都可以整取,但整取餘字不能確定。
例如「總」取非字型的部首「丷」不取下部字型的「心』「彬」取「木」做部首可餘「杉」字,取「彡」做部首可餘「林」字,都可餘字則取非字型的「彡」做部首。
④結構法就是按照字體的結構,先取上部的部首,後取下部的部首,先取左部的部首,後取右部的部首,先取外部的部首,後取內部的部首。這個方法一般用在整取、餘字、分類都不能確定部首時,或者字的部首不能做到整取時。
例如「尖」上、下都是部首,整取、餘字、分類不能確定,我們便按先上後下的辦法,取上部「小」做部首。「倒」左、右都是部首,整取、餘字、分類亦不能確定,我們便按先左後右的辦法,取左部「亻」做它的部首。
「疑」它的部首,不能佔有該字的一個結構縱部即不能整改,我們便按先左後右的辦法把該字的左部 提出然後再按先上後下的辦法取上部 做的部首。
⑤棄聲法就是儘量不取與該字注音相同的部首,作形符,這時字的部首必須是字型部首。之所以這樣做,是由於我們的字母化公式是根據形聲字的造字原理演繹得出,因而在一定程度上,還會受到形聲字某些特點的約束,請看下例a.取與該字注音相同的部首做形符。
方塊漢字=注音十形符-字母漢字功=goo+g(工)=goog汞=goo+g(工)=goog貢=goo+g(工)=googb,取與該字注音不相同的部首做形符方塊漢字=注音十形符。字母漢字功 =goo+l(力)=gool汞 =goo+s(水)=goos貢 =goo+b(貝)=goob由上例可見,對於形聲字來說,若以它的「聲」做部首,就會增加形成同形同音字母漢字的機率,因此在一定情況下舍聲不取是很必要的。當然,我們把形符作為區別同音不同形漢字的符號,在一定程度上也是不必完全拘泥於形聲字的桎梏,而且我們的整取、餘字、分類三法是主要依據形聲字的特點制定的,在一般情況下取聲做部首的機率並不大,因此我們規定,只有當將要取的部首的注音與被取部首字的注音相同時,才懷疑該部首是聲,這時可將其捨棄另取,但是該部首必須是字型部首,非字型部首不在棄聲法之列。
例如「視」部首「礻」是「示」的變形體,儘管「示」的注音與「視」的注音相同,但「礻」為非字型部首,所以我們仍選「礻」做部首。
⑥迫取法就是被迫取一些不是部首的字來做部首使用,或者被迫取與它注音相同的部首做它的形符。
例如「蟲」佔有一個結構縱部的「中」不是部首,而這個字不能再分,所以我們便強取「中」做部首。
「賴」左、右兩部各自總起來看都不是部首我們便按先左後右的結構法原則迫取其左部「束」做部首。
「叛」左、右兩部亦非部首,我們取右部「反」做部首,其左部 不是正規字體為了減少判斷上的麻煩,迫取時儘量取字體正規的字做部首。
「鞏」左部「工」與「鞏」的注音相同,按棄聲法的原則須舍「工」不取,但是「凡」不是傳統意義上的部首,對於這種情況,我們需強取「凡」做部首,但有條件,即捨棄同音部首後,另取的做部首的字,注音也不能與被取部首字相同,如下例中;「勵」它的部首「力」與它注音相同,但其左部的「厲」也與它注音相同,這時我們若強取「厲」做部首,也不能達到棄聲的效果,對於這種情況,我們仍以傳統意義上的部首「力」做形符。
以上便是我們取部首的六條規則,在這六條規則中,前四條的順序性很強。在對字確定部首時,儘量先用整取法,次用餘字法,再用分類法後用結構法,並且能用整改法確定的就不再用其後三種法,能用餘字法確定的則不再用其後二法,能用分類法確定的則不在用第四種結構法,若打破這個順序,則就可能產生矛盾,比如「幕」若先用分類法便須取「艹」做部首,但是用餘字法則只能取「巾」做部首,因此象此類能由余字法確定的是不可以再用第三種方法分類去確定部首的,至於棄聲法與迫取法則是對前幾種方法的訂正與補充是需放到最後去衡量所取部首是否得當的兩條內容。
B、有了取部首的規則,便可以說有部首字形符的確定方法了,一般的我們先取出有部首字的部首做它的第一個形符,其第二個形符則分兩種情況進行確定一、當取出部首後,該字所餘下的部分若為有部首字或為有部首的非字型筆劃結構時,則取所餘部分的部首做它的第二個形符;二、當取出部首後,所餘部分為無部首字,或無部首字的非字型筆劃結構時,則按無部首字形符的確定方法,即用砍頭、去尾、首末筆法,找出所餘部分的第一個形符,做有部首字的第二個形符。
例如「魏」整取法可確定其部首為右部「鬼」則其第一個形符為「g」,所餘「委」仍為有部首字,結構法可確定其上部「禾」為部首,則其第二個形符為「h」,那麼「魏」可字母劃為「Weigh」。
「鉛」整取法確定其部首為左部「釒」其第一個形符為「j」,所餘 為有部首的非字型筆劃結構,結構法可確定其上部「幾」為部首,則其第二個形符仍為「j」那麼「鉛」便可字母化為「qnjj」。
「釋」整取、餘字、分類不能確定其部首,用結構法可取出其左下部「米」做部首,則其第一個形符為「m」所餘部分 再用結構法可取出部首「又」那麼其第二個形符便為「y」該字則可字母劃為「simy」。
「付」餘字法可確定其部首為左部「亻」則其第一個形符為「r」所餘「寸」為無部首字,砍頭去尾不成字,便取「寸」首筆劃「一」的定義字母,則其第二個形符為「h」,那麼「付」便字母劃為「furh」。
「曹」整取可確定其部首為下部「日」則其第一形符為「r」所餘 為無部首非字型筆劃結構,按無部首字的形符確定規則,砍頭即去首筆劃可得字「曲」,取「曲」字的聲母做「曹」的第二個形符為「q」那麼「曹」字便可字母化為「caorq。
三、字母漢字輸入方塊漢字時的幾個問題。
A、輸入的方式由於我們已把聲母用字母與韻母用字母嚴格的區分開來,並且對純韻母注音設置了定音符,所以原則上是可以進行不加空格鍵的整句輸入的。即可以象寫方塊漢字一樣依次排開,只用標點符號對句子加以間隔,但這樣會增加字母漢字在識讀上的困難,因此,在輸入時,我們儘量以詞組或短語為單位進行輸入,比如「我們去北京好嗎?」這句話便可分成「我們—去北京—好嗎?」三個段落輸入,這樣音節長度適中,一旦字母漢字落實應用便可毫不費力的拼讀識字。
B、無形符字、單形符字、雙形符字、三形符宇我們規定用兩個形符做輸字的表準是迫於漢字同音字太多的緣故,但漢字無聲調的音節有三百多個,即便不用形符,也可以表示出三百多個字,並且可供形符使用的字母有二十個(即聲母用字母),用一個音節加一個形符的方式表示一個字的話,在理論上也是可以表示出六千多個字。而生活中最常用的漢字,僅有三、四千個,所以我們是有能力用一個形符、甚至不用形符表示一些常用漢字的,因此實際的字母漢字並非一律擁有兩個形符,按照日常使用的頻率,我們把每個音節上最常用的一個漢字選出來,單獨用音節表示它,並稱它們為無形符字,如「我」、「你」、「他」、「好」、「壞」、「高」、「低」、「大」『、「小」、「很」、「和」』、「前」、「後」、等。一般的無形符字,多為人稱代詞、用意廣泛的動詞、形容詞、副詞、連詞、及方位名詞。
其次,再選出部分常用字,按照其部首情況用一個形符確定它們,即去掉它們的第二個形符。對於這種字,我們稱其為單形符字。單形符字多為常見的實物名詞與行為動詞,如「狗、gouq」、「貓、maoq」、「打、dat」、「砍、kans」、「跳、tioz」等等。
對次常用字及一些用單形符確定不了的常用字,我們僅用兩個形符表示,並稱它們為雙形符字。雙形符字的使用範圍一般比較固定,如姓氏「劉、liudy」、「固定」的「固、guks」等。
另外,漢字的歷史比較悠久,除了常用字和次常用字外還有大量的古字、繁體字存在,這部分字一般情況下用不著,但也有偶爾用到的時候。事實上我們平常看報紙就不能完全避免、尤其對研究中國古文化的專業人士來講更是缺之不可。對這部分沒有不行,有了又常被閒置的漢字,我們便在其兩個形符之上再加一個形符來表示它們,其第三個形符的取法分為兩種情況一、當古、繁體字為無部首字時,其第三個形符為它第二形符的雙寫,如 字母化為「sigdd」;二,當古、繁體字為有部首字時,其第三個形符同於它第二個形符的取法,如 字、先左後右第一個形符為「s(山),』,所餘 右部為部首,其第二個形符便為「g(戈)所餘 按餘字法可得部首「_(虎字頭)」則第三個形符便為「h」那麼 可字母化為「xisgh」。
C、詞的縮寫;對一些常用的固定詞,我們也象英文一樣,取其每個字的首個字母做它們的縮寫,且縮寫的字母間也加間隔號「·」。縮寫的詞,在句子中一般和它前面或後面的隔開,即要有空格。
D、同音同形字的處理方法由於漢語的每個音節上分配的漢字、部首極不平均,在按規則對方塊漢字字母化時,偶爾會有同音同形字出現,這種情況有一部分可被無形符字及單形符字分流,即同音同形字中較常用的字被減掉一個或全部形符成為單形符字或無形符字,從而將它們分別開來。不能分流的,我們一般採用「換取部首法」即將同音同形字中不常用的一個或幾個字會掉其按規則取出的部首,去取字中含有的另外部首或字做形符,比如「伏」與 二字同字母化為「furd」這時我們便對不常用的 字實行「換取部首法」即不先取」 」中的「亻」做部首,而是先強取其右部的「夫」字做部首,則其第一個形符為「f」所餘「亻」為無部首的非字型筆劃結構,砍頭、去尾不是字,則以所餘首筆劃「丿」的定義字母「p」做它的第二個形符。那麼 便字母化為「fufp」,如此便與「伏」字分別開來,如果「換取部首法」不能解決及同音同形字無其它部首可換時,或同音同形字都為無部首字時,我們便給其中不常用的字加第三個形符,在取法上同於古字與繁體字的取法。
E、分音號「,」的用法在漢語中有許多的單純詞如玻璃、編幅、喇叭、尷尬等及一些外來音譯詞如一些國家的名子或地名俄羅斯、尚比亞、佛羅倫斯等這些由單字組成的詞,若單看其中任一字,實際上都是毫無意義可言的,這些字用兩個形符來表示,是沒必要的,也是很麻煩的,對於它們我們便用分音符來簡化。一般的單純詞中的字,我們都加一個形符,然後在其第一個字與第二各字間加分音號;音譯的外來詞則一般不加形符,只在其前兩字間加分音號,如「玻璃」寫作「bow』liw」「喇叭」寫作「lak』bak」「蝙蝠」寫作「bnc』fuc」「俄羅斯」寫作「eu』losi」「尚比亞」寫作「zan』biya」「佛羅倫斯」寫作「fo』lolunsa」
另外,漢語中常用的固定詞組,若要和其末字的縮寫搭配時也可用分音號,如「新聞」xin』w」其中「新」為無形符字。需要注意的是加分音號的詞也儘量不要與它前面或後面的詞連寫即要單獨輸入。
F對不知注音的字與不知怎樣取部首的字的處理方法不知注音的字在輸入時,可依次打出其前六筆劃的定義字母,去檢索該字,不足六筆劃的補空格鍵。
不知怎樣取部首的在輸入時,可僅打出其注音去檢索。
G、一字多音的處理漢字中有許多一字多音的情況比如「長」既可以讀做「caa」又可以讀做「zaa」這種情況由於其注音的不同,可以自然的字母化成兩個字,但有些字卻不行,比如「好人」的「好」與「愛好」的「好」兩「好」意思不同,聲調不同根本就是兩個字,然按字母化規則,卻會字母化成相同的字,此種由方塊漢字自身特點造成的缺憾,我們是不能讓其在字母漢字中延續下去的。對此種情況的處理,我們便以最常用的「好hao」做無形符字寫做「hao」而以使用稍低的「好」做單形符字寫做「haov」即以改變二者形符的方式把它們區分開來。
以上便是我們對漢字實施字母化的主要內容。在本方案中,微機的漢字輸入是實現漢字字母化的重要手段,因而本方案也可以稱做字母漢字輸入法,只要在輸入過程中掌握了無形符字、單形符字及雙形符字,那麼真正的字母漢字便也基本收入你的囊中,但是無、單、雙三種字不是一時可以熟練的,這就需要初學者要有些耐心,儘量先用兩個形符的標準輸入法去輸入漢字,然後在慢慢學會它們。另外,作為漢字來講,其實平、捲舌音及聲調是它非常重要的兩個因素。字母漢字僅靠形符來確定這兩個方面實際上就是繼承了方塊漢字的部分缺點,是改革不徹底的,這也是我們把以上內容上稱做「初級草案」的原因所在。在這方面上我們打算這樣做,即將來本方案若真能實現漢字的字母轉化,成熟的字母漢字正規的印刷體上,便同於現在漢語拼音方案中對聲調的表示法即用「-」 、四符號標在字母漢字的韻母上。至於捲舌音漢語拼音方案中,有將手寫體的「」zh、「zh」。「sh」寫成 「_」樣子的規定。我們也沿襲過來。表示在捲舌音的「z」、「c」、「s」聲母上。這樣我們不但可以在字母漢字上直接獲得平、捲舌音與聲調的信息,而且這樣的標誌還可以有效的把字母漢字同其它拉丁字母文字區別開來。但手寫體可捨去不標。 (1)對部首的注音我們一律按照改後的漢語拼音方案。(2)對「圍」字的外部結構「口」我們也視其為「口kou」。 (3)對體形稍扁的「曰」「yue」在做部首時我們也視其為「日ri」

(4)、(5)兩部首是重新取名進行字母定義的,但部首「木」仍視為字型部首。 (6)、(7)兩部首由於注音無聲母,我們故把其放在純劃類中進行字母義,但兩部首仍為字型部首。
權利要求
1.一種字母漢字輸入法,其特徵在於所述的漢字字母化按照如下規則形聲字=「聲」的注音十「形」的注音聲母=字母漢字;或者,方塊漢字=注音十形符=字母漢字。
2.根據權利要求1所述的一種字母漢字輸入法,其特徵在於所述的內容如下(一)注音規則(1)、以字母「v」代替聲母「n」;(2)、聲母「zh」「ch」「sh」一律去掉」h」,直接寫作「z」「c」「s」;(3)、將韻母「ang、eng、ong、ing」改成以其首字母雙寫的形式代替其本身;(4)、韻母 的表示方法包括(5)、當 單獨處於聲母「n」「l」之後時,其以雙寫的「u」表示;(6)、當 與「n」、「l」搭配時 上的兩點省略表示為「ue」;(7)、除上面A、B兩種情況外 的表示方法都同於原漢語拼音方案。對按照上述1、2兩條內容改後仍超過兩個字母的韻母做精簡處理(8)、將韻母「ian、iaa(iang)、ioo(iong)」中的「i」換做「n」然後再取其改後首尾字母代替其本身;(9)、將韻母「uan 、uai、uaa(uang)」中的字母「u或 換做「o」然後再取其首尾字母代替其本身;(10)、「er」改做「ea」即er=ea;(11)、「uo」直接以「o」表示,即uo=o;(12)、a、e兩字母單獨做注音,後面須墜以字母「u」做定音符即;(13)、o、ac、ai、an、aa(ang)、ei、en、ee(eng),ou九個韻母單獨做注音時後面須墜以「e」做定音符;(14)、ea(er)不需加定音符;(15)、所涉及的二十六個拉丁字母中的a、o、e、i、u、n」六個為韻母專用字母,其餘的二十個則是聲母專用字母。(二)形符規則(1)、漢字筆化的字母定義所述的筆劃分為八種,一般的以筆劃俗名注音的聲母做它們的定義字母「橫」的注音為「hee(heng)」則字母定義為「h」;「豎」的注音為「su(shu)」則字母定義為「s」;「撇」的注音為「pie」則字母定義為「p」;「捺」的注音為「va(na)」則字母定義為「n」;「點」的注音為「dn(dian)」則字母定義為「d」;「提」的注音為「ti」則字母定義為「t」;「鉤」的注音為「gou」則字母定義為「g」;「彎」的注音為「wan」則字母定義為「w」;(2)、部首(形符的又一稱謂)A、漢字變形類這類部首一般是可單獨使用的漢字的變形體。對於它們,我們一律視其同等於原漢字,字母定義即取原漢字的聲母。B、俗稱類這類非字型的部首一般有較廣泛的稱呼,它們的字母定義為其稱呼首字的聲母;C、純筆化類這類非字型部首一般指既無字樣,又沒有廣泛稱呼的一類,它們的字母定義,以其首筆劃定義字母為準;(3)、漢字筆劃間的關係包括相離、相連、相交;(4)、無部首字與有部首字,將不可分的漢字稱做無部首字,將可分的漢字稱做有部首字,並把有部首字歸納為上下、左右、內外三種結構;(5)、無部首字形符的確定對無部首字的兩個輸字形符,我們採用砍頭、去尾、首末筆法三步確定;(6)、有部首字形符的確定,將可以二分的漢字稱做有部首字。
全文摘要
本發明涉及的是一種字母漢字輸入法,尤其是指漢字字母化並使其適合於計算機應用的字母漢字輸入法,所述的輸入法採用現有鍵盤的26個字母並根據本發明指定的規則,將漢字(形聲字)按照「聲」的注音和「形」的注音聲母使漢字字母化,在本發明中,微機的漢字輸入是實現漢字字母化的重要手段,只要在輸入過程中掌握了無形符字、單形符字及雙形符字,就可以在實現字母漢字化的同時完成了字母化漢字的輸入法。
文檔編號G06F3/023GK1405659SQ0112418
公開日2003年3月26日 申請日期2001年8月21日 優先權日2001年8月21日
發明者劉元華, 劉小蘭 申請人:劉元華

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀