新四季網

現代漢語音文輸入法的製作方法

2023-06-10 16:42:21

專利名稱:現代漢語音文輸入法的製作方法
技術領域:
本發明屬漢字電腦音形碼輸入法,音碼為主,形碼為輔。其特徵是用中文西寫的方法將方塊漢字拉丁化為一種拼音文字來實現漢字編碼輸入或直接用來作漢語表意文字。
上海科技日報曾報導上海市有97%的電腦用戶使用漢語拼音碼輸入漢字。這說明音碼比筆形碼更適宜人機對話。但目前廣泛使用的音碼存在三方面問題。
第一,如漢語拼音碼長太長,重碼多;雙拼方案鍵名難記,重碼也多。又如「狂拼」,佔硬碟空間大,重碼也多,難在掌上電腦中實施。一些較新的音碼專利如CN1202045A音代碼計算機漢字輸入法,除雙拼結構外,還要輸入數字聲調碼,使指法複雜,輸入慢。又如CN1202043A全信息漢語編碼,功能包括拼音碼+聲調碼+順序碼+含義碼+語法碼,信息雖全,但碼長超過8字符。再如CN1219699A漢語音字輸入法,編碼時採用了漢字數值化轉換序字法,漢字以6為周期來確定標準組數,所有漢字分為6種結構來歸類標調,難度較大;而所有韻母均以一個拉丁字母表示,記憶困難,不易朗讀,又回到雙拼方案上去了。
第二,現有方案對拼音碼中雙字符聲母的處理,大都是另選字母代用,如CN1219699A,zh、ch、sh、替換為x、ψ、φ。CN1202045A和CN1127383A中zh、ch、sh用z、u、v來替換。這使編碼發音難以聯想,難以兼作文字功能。
第三,在已有的標調方案上,標調字母大都用在第3位或不定碼位,或字尾另加調母,這在編碼連寫時給計算機分詞帶來困難。過去國際羅馬字標調變字法局限於部分韻母,而且規律不一,致使所變化的韻母不能用同一規則一貫到底。
本發明的目的是為了改變現有方案的缺點,用2~4個字符來表示單字詞的聲、調、韻、形。使編碼既可作為注音符號朗讀(標有聲調韻),也可作為拼音文字表意(每詞獨立成形,無重碼),還可直接輸入漢字並通過軟體生成漢字,達到集語言、文字、編碼三功能於一身的目的。一.音文拼音的規則為縮短碼長,但又要保證足夠的讀音依據和漢字表意功能,本發明規定每字發音用2~3個字符,即聲符用一個拉丁字母,韻符用1~2個拉丁字母,調符規定在第2碼(字符—下同)上用字母變調,不再增加碼長。即音字=聲符+調韻符+後韻符音文由音字組詞並以詞為單位輔以空格、標點符號構成。對重碼的音詞要加形符識別。26個拉丁字母在音文中的作用與在漢語拼音中有很大不同,有24個字母要兼作調符。
1)聲符21個包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、零聲符v、罕聲符w、y。(除q、w外都要兼作調符)罕聲母w、y只用於wey和yo及所屬各調替換漢語拼音的ueng和io。
2)音字的單韻符用1碼、複韻符用2碼,對漢語拼音的韻母作如下替換韻母a、o、e、i、u、ü替換為可變調的韻符a、o、e、i、u、y;韻母ai、ao、ei、ia、ie、ua、uo、üe替換為可變調的韻符ai、`ao、ei、ia、ie、ua、uo、ye;韻母iao、iou、uai、uei替換為可變調的韻符io、iu、ui、ue;韻母an、en、in、uen、ün替換為可變調的韻符aa、ee、ii、uu、yy;韻母ang、eng、ing、ong、uang、替換為可變調的韻符ay、ey、iy、oy、uy;韻母ian、uan、üan、替換為可變調的韻符iw、uw、yw;韻母iang、iong替換為可變調的韻符ya、yo;至此,漢語拼音的21聲母都以2碼的韻符替換,這就使音字壓縮到只有2~3碼的碼長,且保持了較好的直觀和記憶規律。
3)變調規則。音字的變調是非常重要的,漢語拼音只有417個音,這是重碼多的主要原因,若以四聲調(不計輕聲)計算,漢字就有1300個音,音文字通過變調字符獲得1300個2~3碼的不同拼法的音字,不需加形符就能代表1300個不重碼的常用漢字。
始終用音字韻符的前韻符變調(即第2碼變調)。
前韻符只有6個,後韻符7個(增加w)。6個前韻符各可變為四個調,按陰平、陽平上聲、去聲四個聲調的順序(音文24韻調規則)排列如下陰平陽平 上聲去聲a變為 a bc d
e變為 ef ghi變為 ij klo變為 mn opu變為 rs tuy變為 vx yz四調變化舉例漢語拼音da-音文da搭-da,答-db,打-dc,大-dd漢語拼音peng-音文pey烹-pey,朋-pfy,捧-pgy,碰-phy漢語拼音tong-音文toy通-tmy,同-tny,統-toy,痛-tpy漢語拼音chuang-音文quy窗-qry,床-qsy,闖-qty,創-quy規定在第2碼變調,音字可連寫,保證人機分字識別。二.形符音字能無重複地表達1300個漢字音節,同時代表1300個「音」中的最常用漢字(主音字)。要表示更多的單字詞則須加形符以避免與1300個主音字重碼。
可單獨使用的音字是單字詞,詞尾加該漢字部首的代碼或聲符(或第一韻符)。多字詞由音字組成(音字之間一般不加形符,故在音文中形符很少使用)。重碼時可在詞尾加一漢字部首代碼或聲符(或第一韻符)。b卜八勹冫比貝白採鼻 宀疒c艹彳齒d、刀大歹鬥豆 氵e二兒耳f匚父風方缶 木犭g工廾廣弓戈瓜艮谷革骨鬼 竹乙h一火灬戶禾黑i訁又廴弋么業衤頁衣酉言音j冂幾巾彐已見斤釒臼角金 爪舟隹k凵口 日曰l力龍立耒老滷裡鹿 刂亻 人m門糹馬毛毋目皿矛米糸麥黽麻n女牛鳥 土p丿攴攵片皮髟 阝卩冖q犬氣欠青其廠寸屮巛車丬臣蟲赤辰s十厶士夂飠屍礻示石四矢舌豕食t亠田 扌u尢囗王韋瓦文x小夕忄心穴西血辛丨山彡水手殳疋身鼠y月肀用羊羽雨魚z子止自走足豸辶若第3碼的形符會與調韻符混淆時,可另取區別符。在a後可用e、u,在o後可用a、e,在e後可用a、o、u,在y後可用i、u。形符舉例GB2312-6763個國標漢字中hé音有20個漢字,音字寫法hf(e的陽平,e變調為f)主音字和hf(不加形符)重音單字詞(加形符區分)荷hfc,核hff,禾hfh,何hfl,合hfk,盒hfr,闔hfm,貉hfz,河hfd,頜hfv,翮hfu單字(組詞後用,組詞後有重碼詞再加形符)菏閡涸劾紇曷盍由於一音四調,故組成雙字詞後重碼率僅為漢語拼音碼的1/4×1/4=1/16。三.音字組詞可連寫,本發明規定音字第3碼必是元音或半元音,若不是,則為2碼字,若是則為3碼字。解鈴還需系鈴人jkeljyhbixrjlljyrfe三萬八千四百五十六saavuwbaqiwslbbivtsxllu大學ddxse 大雪ddxte四.本發明與現有技術的比較舉例比較中文文本 「銀行必須服從客戶的指示,而不是別人指示。例如,當一個客戶第一次開戶時,他指示銀行僅以他籤發的支票付款。」英文文本「The bank must obey its customer’s instructions and notthose of anyone else.When,for example,a customer first opens anaccount,he instructs the bank to debit his account only in repect ofcheques drawn by himself.」漢語拼音碼「yinhang bixu fucong kehu de zhishi,er bushi bierenzhishi.liru,dang yige kehu diyici kaihushi,ta zhishi yinhang jinyi taqianfa de zhipiao fukuan.」(選字鍵不計在內)漢語音文「Vjihby blxv fscny khhu de zyszs,vfr busz bjrfe zyszs.Llrs,day vi-gh khhu dlvi-cl kaihu sxk,ta zxszs vjihby jkivk ta qiwfa dezvplo fuktw.」(無重碼,無需選字)中文51字英文213鍵漢語音文137鍵 輸入速度2.68鍵/漢字(音文聲、調、韻與漢字字字對應,可準確朗讀,準確表意。「時」、「指示」二非主音詞已加形符,不再重碼)。
權利要求
1.一種現代漢語音文輸入法,其特徵是用26個拉丁字母作為音文26個字符,每字符為1碼,用2~4個字符即聲符+調、韻符+形符組成音字,通過表述每個漢字的聲調韻形來代表漢字或輸入漢字。其中1)直接採用計算機標準鍵盤輸入;2)音文聲符b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r和零聲符v,罕聲符w、y,共21個。將漢語拼音雙字母聲母的拼音形式zhi、chi、shi,替換為音文字符zy、cy、sy。將在以a、o、e、u為首的韻母前的zh、ch、sh替換為j、q、x。罕聲符用於音文wey、yo兩音及其各調,替換漢語拼音的ueng和io。3)將漢語拼音中的韻母a、o、e、i、u、ü、ai、ei、ao、ou、ia、ie、iao、iou、ua、uo、uai、uei、üe、an、en、ang、eng、ong、ian、in、iang、ing、iong、uan、uen、uang、üan、ün替換為可變調的音文韻符a、o、e、i、u、y、ai、ei、ao、ou、ia、ie、io、iu、ua、uo、ui、ue、ye、aa、ee、ay、ey、oy、iw、ii、ya、iy、yo、uw、uu、uy、yw、yy。4)用音文字韻符的前韻符作為調韻符,用字母變調法變調,其特徵是,變調字母取26個拉丁字母中的24個,並按拉丁字母順序排列。按陰陽上去四調順序a變調為a、b、c、d;e變調為e、f、g、h;i變調為i、j、k、l;o變調為m、n、o、p;u變調為r、s、t、u;y變調為v、x、y、z。5)漢語音文以詞和空格為單位書寫或用鍵盤輸入,詞尾加形符的規則是在單音詞或多音詞的詞尾加以漢字部首的代碼或聲符(或第一韻符)。代碼宀疒-b,氵-d,木犭-f,竹乙-g,日曰-k,刂亻人-l,土-n,阝卩-p,扌-t,辶-z。
2.利用權利要求1.2)3)4)5)的方法作為漢字的注音手段和難字部首與字根的合字手段。
3.利用權利要求1所述的方法作為信息交流的媒介和手段。
4.利用權利要求1說述的方法作為人機對話,語言發聲和語言翻譯的手段。
全文摘要
本發明公開一種現代漢語音文輸入法。使用26個拉丁字母的不同組合來表達漢字的聲、調、韻、形。5000常用單字詞無重碼,輸入現代漢語無需選字。在不省略、不縮簡、詞輸入和漢字與音字一一對應的情況下,平均2.7鍵/字左右(含空格)。不僅能「盲打」,更宜「想打」和「聽打」,使中文對於電腦和西文同樣方便。繁簡漢字也易於交換或統一。該碼系中文西寫,易學難忘,可供手機和掌上電腦交流信息,也給網上聊天以及用漢語編寫計算機高級語言帶來方便。
文檔編號G06F3/023GK1388430SQ0111299
公開日2003年1月1日 申請日期2001年5月25日 優先權日2001年5月25日
發明者諸葛元, 諸葛嘉 申請人:諸葛元

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀