新四季網

《中文聲數編碼》方案及其實現方法

2023-12-10 04:48:31

專利名稱:《中文聲數編碼》方案及其實現方法
《中文聲數編碼》方案屬於《漢字編碼》技術領域:

《中文聲數編碼》方案包括《漢字編碼》、《現代漢語語詞編碼》兩個編碼和在國際通用的西文鍵盤上的《鍵位圖》三個部分組成該方案。從1973年著手編寫,於1981年完成了《漢字編碼》和《鍵位圖》,1983年全部完成了七萬條語詞的收集和編碼,並列印了全部碼本資料計21冊70餘萬字。這個項目的完成主要用的工具書為《漢語拼音方案》、《新華字典》、《新華詞典》、《現代漢語詞典》、《辭源》、《成語詞典》、《哲學詞典》、《標準電碼本》、《英文打字機鍵盤》、《中華人民共和國國家標準字符集基本集》等。
隨著計算機的發展和普及,漢字編碼已普遍引起國內外有關學者的重視,到目前已有400多種方案,國內已上機的有30多種(《計算機世界》1984年6月29日),其中影響較大的有河南王永民的《五筆字型》,北京師大李金凱的《筆形輸入法》、水科院李惠勤的《拼形法》;其它還有臺灣的《倉頡編碼》、美國王安的《三角碼》。
反映上述有關技術的文章可見《中文信息處理國際研討會論文集》中國中文信息研究會出版1983年10月23日信息是人類社會的第三資源。信息的及時收集和傳輸決定信息的價值。中文信息的現代化處理是世界各種語言文字中最難處理的文種,這主要由於漢語的書面符號-「漢字」的數量繁多、字形又複雜,還有大量的同音字所決定的。計算機處理文字信息的全過程,一般包括文字信息的輸入、存儲、處理、傳輸及輸出五個環節。但障礙中文信息處理的主要問題是中文信息的輸入,而輸入速度受限制和輸入方法不能普及推廣的關鍵,目前又集中在漢字的編碼上。因此,漢字編碼被稱為中文信息處理的「瓶頸」問題。
研究的目的是要提出一個好學、好用、不需記憶,輸入速度快,不費腦力,輸入活動又能和人腦對語言的思維活動一致,不分行業、年齡都能掌握的易於普及的方案。
《中文聲數編碼方案》,又稱《漢語拼音編碼方案》。它嚴格遵照《漢語拼音方案》的規則,利用計算機的功能,採用聲母、韻母、調號、序號組碼定字的方法,從而簡捷又準確地解決了中文同音字、同音詞的區分識別問題。使用漢語拼音編碼輸入漢字或普通話語詞,利用計算機自動轉變漢字輸出,這是中文信息處理的一條寬廣的捷徑。
《中文聲數編碼》方案組碼根據漢字的普通話讀音,以音編碼,並規定五個拉丁字母標聲調(J、X、V、H和W分別為陰平、陽平、上聲、去聲和輕聲的聲調號),用阿拉伯數碼標同音字。在同音同調的音節中,使用頻度高的漢字排在前位,以方便查找選定。
該方案編碼容量不限,可容所有漢字。現集合9771個漢字,包括《國標GB2312-80》和《標準電碼》本中所含的漢字;現代漢語語詞編碼7萬條。
這種編碼,組碼簡單,直觀可讀,因而它易學、好用、精密、準確、無需記憶。可高速盲打,便於普及。尤其重要的是這一方案能使操作者對語言的思考和手指的鍵入自然的溶為一體,並且適於聽打,省去了見字組碼的極其緊張的腦力勞動;從而使計算機由漢字打字機成為中文編輯處理機。
一、方案的主要技術指標1.容量漢字9771個詞7萬條2.編碼基數
通用鍵盤26(+10)3.碼長字碼L1=1-5詞碼(字)L2=1.74.鍵入速度理論中值90-150字/分5.重碼數06.重碼出現率07.每字平均擊鍵數字碼∠3詞碼∠2二、漢字的編碼1.漢字全碼漢字的全碼由其聲、韻、調序組合而成。如「科」字,其編碼為KEJl2.漢字的縮位碼在確保漢字編碼準確性的前提下,對現代漢語中的高頻字,有規律地壓縮碼位,縮短碼長,減少碼位;以提高鍵入速度。縮位碼有三類(1)一碼字又稱高縮位碼字。它是選定26個最常用字。用一個字母作其高縮位碼。如「的」字的編碼為「D」,「是」字的編碼為「S」……。這些高縮位的一碼字,約佔現代漢語總用字量的20%。
(2)二碼字在不計聲調差異的408個音節中,選定該音節中最常用字,由該字的聲母,韻母組成二碼字。例如在以「B」為聲母的音節中「把」為「BA」「百」為「BAI」,「辦」為「BAN」「幫」為「BANG」、「報」為「BAO」……。兩碼字與一碼字累計可佔現代漢語書面材料中總用字量的60%以上。
(3)三碼字標有聲調符號的1300多個音節中的第一號位字,都是所在音節的最常用字,規定凡一號位的漢字的編碼減縮為「聲、韻、調」三單元組成,省去序號1。這樣組成三碼字。例如在GUANG音節中,「光」的編碼為「GUANGJ」,「廣」的編碼為「GUANGX」。「逛」的編碼為「GUANGH」。
三、現代漢語語詞的編碼詞是語言中最基本的造句單位。現代漢語以雙音節詞為主,因此對漢語信息的現代化處理,以詞為單位,按詞音進行編碼,較之以單音節的漢字編碼,更簡單明了和便於學習和使用。
詞碼分1.單音節詞同字碼單音節詞碼與字碼相同。
2.雙音節詞碼是由組詞的兩個音節和序號組成碼位。音節均不標調,拼音按詞連寫,同音詞加序號標定。標定序號也從第二號位的同音詞開始,一號位不標,是自然的一號。同音詞中也將常用詞排在前位。
雙音節詞還選定了部分最常用詞,進行縮位,組成雙音節詞簡碼。
3.三音節、四音節及四音節以上的詞、固定詞組、成語、短句等的編碼。
這部分詞的編碼是用詞漢字的拼音字首組成縮位碼,組合拼音字首排列順序全同就加序號標定。序號也從第二號位開始標起,一號位是自然的一號,但省去一號碼位。
在四音節詞中,拼音字首組合排列都相同的出現機率極少,如在以B開頭的四音節詞編碼中,需標調號的僅有5%。
在四音節以上的固定詞組、成語等,拼音字首排列組合全同的就更少。
縮位詞碼,不但減少了漢字的碼位,而且還降低了對拼音知識的要求,這樣就使對漢語的信息輸入手段達到最簡單易用的階段。
4.常用名、址和高縮位詞碼常用名、址,包括古今中外名人名字,我國省、市、自治區名,黨政、軍、群眾團體的名稱等,都集合編碼,有的用特定代號組成高縮位碼。如中華人民共和國編碼為「Z.」,中華人民共和國郵電部編「Z.YDB」;北京為「BJ」;山東省為「SD」。
四、編碼結構圖該方案的字碼、詞碼結構圖如下1.字碼一碼聲二碼聲韻三碼聲韻調四碼聲韻調序五碼聲韻調序序2.詞碼①雙音節詞碼{四碼聲韻聲韻五碼聲韻聲韻序②縮位詞碼雙音節縮位詞碼聲聲聲聲聲序三音節縮位詞碼聲聲聲聲聲聲序四音節縮位詞碼聲聲聲聲聲聲聲聲序五音節或五音節以上的縮位詞碼取前三音節聲+末音節聲(前三末-拼音字首)
五、《中文聲數編碼》的鍵盤設計漢字為音節文字,現代漢語共約415個可讀音節,這415個音節節分別由24個聲母(包括零聲母和準聲母)39個韻母拼合而成;本方案又選定5個字符標聲調。因此,方案在通用的26個字符鍵位的小鍵盤上實現,完全有賴於將這68個代表不同意義聲、韻、調的組碼單位科學地、有順序安排在26個字符鍵位上,實踐實現了這樣的願望,使用通用的小鍵盤,可以嚴格按漢語拼音的拼讀規則,拼合出所有實用音節,不重不漏,從而能選定各音節中所有任一個漢字。
1.鍵位安排,見附圖(1)2.說明在國際通用的鍵盤上,26個字符鍵位上標有組成漢語音節的24個聲母鍵位。(21個聲母,兩個準聲母y、w,一個零聲母用「O」鍵代);35個韻母鍵位,5個聲調符號鍵位。這64個聲、韻、調符號按照互補原則,以順序識別的方法巧妙地排列在26個鍵位上。其中聲母用大寫字母、韻母用小寫字母,聲調號分別用「J、X、V、H、W」鍵表示一、二、三、四和輕聲。
單字母聲母、韻母和多字母聲母、韻母都分別用一個鍵位。如「窗」的拼音為「CHUANG,其中「CH」在「I」鍵位,「UANG」在「Q」鍵位。
六、聲數編碼分類聲數編碼有漢字碼和漢語語詞碼兩類。
1.漢字碼漢字碼又有基本型和普及型兩種(1)基本型。
基本型字碼有全碼和簡碼。
基本型漢字全碼包括所收的所有漢字,它由聲、韻、調、序4-5個碼位組成。如「香」字,它的全碼是「Xiang J 3」。
基本型漢字簡碼有三級①一碼字選有26個最常用漢字為一碼定字,如下表
②二碼字不加調號標定的各音節中的最常用字,選定為聲、韻兩碼字。
③三碼字三碼字為加聲調號標定的1300多個音節中的最常用字(除去一碼、二碼已選定的常用字),用聲、韻、調組成三碼字。
(2)普及型普及型對於略懂漢語拼音,只是具有勉強拼讀出不分聲調號的音節的人使用。普及型的組碼由聲、韻、序三個部分組成。碼位長3-4。普及型的一碼字、二碼字均與基本型相同。對於不會拼音的還設有中、老年普及型鍵位。
2.漢語語詞碼。
漢語語詞碼有雙音節詞簡碼、三音節詞碼,四音節詞碼等。詞碼的組碼是取拼音首字母再加一個詞碼標識符「·」順序組成。如「國家」-「CJ·」,「人民」-」RM·,」,「欣欣向榮」-「XXXR·」、「新華社」-」XHS·」。
七、人機對話、分層顯示、順序選擇聲數編碼組碼和輸入使用,簡單方便,不論老年兒童,機前一經指點就會上機操作。通過巧妙的「人機對話」,實行「分層顯示、順序選擇、自然組碼」。現分別介紹其使用方法,如下1.基本型漢字碼使用法如「我愛我的祖國」這句話的組碼為「W oai W D ZUV2Guo」輸入時不需要事前組碼、組碼和輸入溶為一體邊輸入、邊組碼、邊選定,三「邊」同時進行。如上例一句話,首先輸入「我」字,「我」字的拼音為「Wo」。當你一按「W」鍵時,「我」字便出現在屏幕選擇行內。因正合所需,你就立即按空格鍵,一按空格,「我」字馬上跳到本文你所準備的適當位置上。第一個字輸入完成後,接著輸入「愛」字。「愛」字的拼音為「ai」,是零聲母音節。所以要先按「o」鍵,屏幕選擇行上顯示「中」字,因不是所需,就不去管它。接著按韻母「ai」鍵,「愛」字便立即顯示。因是所需,所以,按空格,好像通知計算機「你找對了」,「愛」字就迅速跳到「我」字後位,入伍了。接下去再輸入第三個字「我」,如第一個字同樣輸入,「我」字能整齊地排在「愛」字後面入隊了。第四字為「的」。「的」的拼音為「de」,所以先按「D」鍵,手指一觸「D」鍵,機上馬上顯示「的」字,又正合所需,照樣用空格鍵通知計算機「正是」,「的」字又跳到應去的位置上去了,再輸入「祖」,「祖」字的拼音為「Zu」,所以先擊「z」鍵,屏幕顯示「在」字,因不合需要,接下去按「u」鍵,一方面告訴計算機,「你給我的「在」字不合我的需要,馬上再給找」;在你手指一觸「u」鍵時,機器就會明白了你的意思,立即給你送出「組」字,這個「zu」音節的最常用字,供給你識別。「組」字的出現雖不合需要,但它已告訴你,「祖」就在這附近住;接下去你再擊「V」鍵,於是機上就迅速出現這樣情況
「阻字」先進入行列,整齊地排列在「的」字後面,同時選擇行中出現(注)0 1 2 3 4阻 組 祖 詛 俎一行字。即「Zu」音節中的同音字一起站出來受閱了。如果你需要的是「阻」字,你按空格,「阻」字就停在它搶先佔領的位置上,選擇行的一組字就同時退回。(這就是三碼字和三碼字的使用法)。但現在你不需要「阻」字,而是需要頭上標有「2」的「祖」字,所以,你迅速去擊「2」鍵,一方面通知機器,趕快要「2」號去;一方面又告訴「阻」字快回去,把位置給「祖」字。一擊「2」字鍵,這兩條命令就同時執行了,祖字牢牢地佔據應佔的位置,「祖」字輸入完成。還有「國」字,「國」的拼音為「Gao」,依序先擊「G」鍵,機上出現「個」字,接著擊「uo」鍵,「國」字就應聲出現,再按空格,「國」字就到位。於是「我愛我的祖國」六個字就整整齊齊的站在一起了。輸入全部完成。熟悉了,第一鍵後是按空格還是擊韻母鍵不需要看屏幕就能順利地決定第二鍵了-只要不是一碼的那26個字,你就去擊相應的韻母鍵,是就鍵擊空格。
2.用普及型字碼輸入「我愛我的祖國」。其中「我」「愛」「的」「國」」等一碼,二碼字與基本型一樣,只有「祖」字不同,因為你不知道他的具體街道-即不知道「祖」屬那一個聲調,僅知道它的粗略發音為「Zu」,所以你順次擊打「z」和「u」鍵後,組字出現在選擇行時,你會高興的會意到「啊,差不多了!」但「祖」究竟在那個「門」住,你還不能確定,你得打聽一下,打聽誰呢?你一按「?」鍵,計算機就像熟練的戶籍警一樣,馬上會意到「啊!你對『祖』的位置不清楚嗎?這不要緊,我就告訴你」-於是選擇行中迅速出現
0 1 2 3 4 5 6 7 8 9租 族 足 卒 阻 組 祖 詛很快你會發現「8」號住的「祖」字正是你所尋擊「8」字鍵,「祖」就到位。
3.語詞碼的輸入語詞碼組碼和輸入更加簡單如要輸入「中國人民站起來了!我們可愛的祖國更加偉大了!」這段話中有雙音節詞7組,單音節詞6個,總共20個漢字。這段話的組碼為「ZG·RM·ZanH QL·L WM·KA·D ZG·Geng Jia WD·L!」中國人民站起來了!我們可愛的祖國更加偉大了「·」為雙音節簡碼詞碼的標識符,也是詞碼的碼元(即組碼成份)單音節詞碼與字碼相同,因此輸入方法也一樣。
輸入詞碼就是按組詞音節首字母順序擊鍵輸入,最後再加擊「·」,詞就到位。
4.能否將聲數編碼的規則和輸入方法概括地總結一下呢?能!下段話就是觸鍵顯字是一碼聲韻配合408,聲母韻母加調號,一點空格字到家;
聲韻調序定全碼,易學易用人人誇。
也可歸納為一碼字音首
二碼字聲韻
三碼字聲韻調
四碼字聲韻調「?」序或聲韻調序五碼字聲韻調「?」
序或聲韻調數數(「
」為空格,「?」為選擇鍵)注字詞兼容時,基本型的全碼字在打聲調鍵後,也要加擊一次「?」鍵,以提供選擇。
《中文聲數編碼》方案同目前現有技術相比所具有的優點漢字編碼方案歸納起來有三類形碼即按漢字字型結構編碼;
音碼以漢字的普通話讀音編碼;
音形碼既取漢字的讀音又取其結構特點來組碼。
由於漢字的字形各異,筆劃又繁多,因此不論哪種形碼方案都要有繁多的規則要用戶記憶(如需要將近九百個漢字部件合併歸納為近160個「字根」,再將這「160」種字根排列在26個字符鍵上),而且見字組碼時更需要一個緊張的腦力勞動過程(以上有人稱為二次或三次映射活動)即要分析字的筆劃、結構、筆順,然後決定取那幾個特點組碼,然後再找鍵位依次輸入,很費腦力,一般用戶困難很大。在沒有文稿可照的情況下就更加困難,不能適應未來無紙張的自動化辦公的需要。目前在有的機器上的「拼音法」是按漢字的拼音符號一個個符號輸入、速度慢、易出錯。本方案按聲、韻兩鍵就能確定音節。詞碼的實現將使漢字的輸入速度成倍的提高,而且規則簡明,易學好用,不要記憶。歸結起來,本方案主要具有以下五個特點1.準確地可讀性-適於聽打、盲打本方案的字碼,由漢字的普通話讀音加序號組成,其中聲、韻、調清晰,提示行的漢語拼音完全和拼音規則一致,因此,組碼和提示都具有準確地可讀性。用戶能「見字知碼、見碼識字」,組碼容易、自然,而且可使人腦對語言的思考和人手的鍵入活動,有機地溶為一體,便利於用中文計算機起草文件和不用解碼不用預先寫報文的電報通信。
2.廣泛地群眾性-利於普及和推廣本方案尤其對青少年來說,從僅上三個月學的一年級小學生和只有一個月漢語學習學令的外國留學生,都可不經專門訓練,在機前臨機一指點就能上機操作。方案結合我國國情設計有基本型和普及型兩種類型,可供不同年齡和漢語拼音知識的人選用。對不認識漢語拼音的中老年知識分子,還設計有用「漢字拼讀」音節的鍵位圖,使方案適應面廣,易於普及。
3.可擴展性-用途廣泛本方案能規律地從字碼自然地擴展為語詞碼。編碼可做為計算機中文輸入碼,還可不需改動直接用於電報通信-包括用舊式電傳機的通信;還可作為旗語通信。方案的實現還可成為漢字和漢語的正音正字學習機,對外國人來說是一種現代化的教學漢字的教學機。
4.嚴密的科學性本方案嚴格地遵守漢語拼音方案的拼寫規則;字碼的排序、詞碼的收集整理以及聲、韻母的選留,鍵位的設置和確定,確是在大量的統計分析基礎上進行的,有規可循、配置合理。
5.穩定性-利於國家標準化本方案和中國文字改革的方向一致,而且是普通話的推廣和漢語拼音知識普及的現代化工具。隨著時間的推移,本方案愈益易於推廣普及。文字簡化工作的進行,都對本方案毫無影響;本方案還有利於文字改革學術中兩派對立意見的統一。
附圖(1)為《中文聲數編碼》方案的鍵位圖,在字符鍵中鍵位左上角大寫字母為通用的西文鍵位拉丁字母符號;在中文方式下其中Q、W、R、T、Y、P、S、D、F、G、H、J、K、L、Z、X、C、B、N、M為聲母鍵,「U」、「I」、「V」三鍵右側分別標有「ZH」、「CH」、「SH」為三個合成聲母鍵位,「O」鍵為「零」聲母鍵。以上為24個聲母鍵位;26個鍵位右下角所標的小寫字母(或組合)為韻母鍵位,從左至右,由上而下按順序為uang iang、ong iong、e、er、iu、eng、ai、u、i、o uo、uan、a、ing、iao、ao、ang、an、ian、un ui、ue、üe、uai、ü、ua ia、en、ei、ou、in、ng ie,共35個韻母鍵位;「J、X、V、H、W」五個鍵位右上角標有「-、
」,五種符號為「一、二、三、四和輕聲的聲調號。該五鍵為聲調號鍵位。一個鍵位中有的同時具有聲、韻、調的功能(有的還有2-3個韻母),它們的組合反映了漢語音節的互補和互斥規律,以及鍵盤鍵位設計中的順序識別的原則。這樣的安排,使現代漢語的415個音節中的任一個音節都可兩鍵決定;如加擊第三鍵,則1332個帶聲調的音節也能唯一的確定。
符號鍵中按漢語語法規定,定義了四種標號《》、-、…、「」『』和七種點號「,、°、丶、;、!、?、」,在中文方式下除破折號、省略號外,均為一鍵一個中文標點符號,佔有一個漢字位。其它符號如數字符號等都同西文方式一樣功能。
鍵位圖(2)供不認識漢語拼音字母的中老年知識分子使用的鍵位圖。使用時可按圖示作籤,貼在相應的鍵位上(或貼在鍵位對面),其中左上角漢字下帶橫_的為聲母代表字,下邊的小字為韻母代表字。使用時兩字相拼(即聲與韻母相拼)就能確定音節,然後再按「?」鍵選字輸入。標貼時聲、韻母可用不同顏色以示區別。聲、韻母與其所取的代表字對應關係如下聲母B-玻、P-坡、M-摸、F-佛D-得、T-特、N-訥、L-勒G-哥、K-科、H-喝、J-基、Q-欺、X-希ZH-知、CH-吃、SH-詩、R-日Z-資、C-雌、S-思Y-(衣) W-(烏) O-(零聲母)韻母a-啊 o-喔 e-鵝i-衣 U-(烏、迂) ü-(迂)ai-哀 ei-欸 ao-熬 ou-歐an-安 en-恩 ang-昂 eng-亨ong-轟ia-呀 ie-耶 iao-腰 iu-憂ian-煙 in-因 iang-央 ing-英iong-擁ua-蛙 uo-窩 uai-歪 ui-威uan-(彎、冤) un-(溫、暈) uang-汪üe-約er-兒中文聲數編碼方案是一個很好的漢字編碼方案。為了充分發揮該方案的優點,在計算機系統上實現時,採用了獨到的方法。該方法要點如下1.按擊鍵順序確定聲母、韻母和聲調號中文聲數編碼方案使用的鍵盤是專門設計的中、西文共用的鍵盤。鍵盤鍵位的安排如圖1所示。鍵盤上的每一個鍵,除代表本身的英文字母外,還可能代表中文聲數編碼中使用的聲母、韻母和聲調號。一個鍵位功能多用。如H鍵,除代表英文字母H外,還代表漢拼聲母「H」和韻母「an」。在鍵入漢字時,按擊鍵順序確定鍵位具體代表的含義。根據中文聲數編碼規則,一個漢字的編碼由聲母+韻母+聲調號+序號組成。因此「方案」規定,第一鍵作為聲母鍵入,第二鍵作為韻母鍵入,第三鍵作為聲調號鍵入,第四鍵和第五鍵字碼作為序號鍵入。這樣準確地區分了鍵位所代表的不同含義。
2.用字母O代表零聲母對漢語拼音中的零聲母字,例如啊(a)、安(an),按漢語拼音規則規定,他們的聲母是0(零)聲母。中文聲數編碼規定凡屬於零聲母的字,在計算機上實現時,它們的編碼也由聲母+韻母+聲調號+序號組成;零聲母鍵位用鍵盤上的字母O代表。
3.在鍵入漢字的過程中,對簡碼字(縮位碼字)進行提示中文聲數編碼方案中規定了簡碼字(縮位碼字)。其中一碼字26個,二碼字408個,三碼字1332個。這許多簡碼字靠人去記憶是非常困難的。對一般用戶來講,基本上是做不到的。為了使這些簡碼字真正發揮作用,起到壓縮鍵入漢字的平均碼長的作用,在計算機上實現中文聲數編碼時,採取了對簡碼字進行提示的方法,以省去使用者對簡碼字的記憶負擔。方法是,把顯示器屏幕劃分為兩部分,最底下一行是提示行,屏幕的其它部分稱為屏幕正文。隨著鍵入漢字的中文聲數編碼過程,隨時提示相應的簡碼字,一目了然,從而使使用者不必記憶這許多簡碼字,使簡碼字進入實用階段。
在提示行內提示簡碼字的方法,不僅適用於中文聲數編碼,也適用于于其它的具有簡碼的漢字編碼方案。該方法使簡碼字真正具有使用價值,而不是形同虛設,從而使簡碼字的使用進入了一個新的階段。
4.在提示行內顯示漢語拼音為了使中文聲數編碼成為學習漢語拼音和學習漢語的有力工具。隨著鍵入漢字的中文聲數編碼,在提示行內顯示相應的漢語拼音符號,而不是鍵位原先所代表的英文字母。照此方法設計出來的漢字系統,是中、小學學生和外國人學習漢語和漢語拼音的良好教學工具。
5.使用英文鍵盤上的問號(?)鍵,作為挑選漢字的工具。
為了使不太熟悉漢語拼音的人使用中文聲數編碼,可以規定用問號鍵(?)作為挑選漢字的手段。挑選的範圍分為三檔同聲母漢字的挑選,同音節漢字的挑選,具有相同聲周號的同音節漢字的挑選。
上述要點已在清華大學、煙臺電子所、芝華公司和福山師範聯合研製的QPC-DOS漢字作業系統上實現。
權利要求
1.一種編碼方案其特徵在於該方案是中文聲數編碼的方案,和中文聲數編碼方案的鍵位圖。
2.按照權利要求
1所述的中文聲數編碼的方案,其特徵在於該方案是一個漢字的編碼由聲母加韻母加聲調號加序號組成。
3.按照權利要求
1所述中文聲數編碼的方案,其特徵在於該方案其特徵在於漢字全碼由聲、韻、調、序組合而成。
4.按照權利要求
1所述中文聲數編碼的方案,其特徵在於該方案設有三類縮碼位(1)是選定26個最常用字為一碼字(2)是選定408個常用字以聲母加韻母組成二碼字(3)是選1332個次常用字以聲母加韻母加聲調號組成三碼字
5.按照權利要求
1所述中文聲數編碼的方案,其特徵在於該方案選用拉丁字母為聲調符號,五聲分別由五鍵代表J 一聲X 二聲V 三聲H 四聲W 輕聲
6.按照權利要求
1所述的中文聲數編碼的方案,其特徵在於該方案的雙音節詞的全碼由組詞漢字的「聲韻聲韻」或「聲韻聲韻加序號」組成。
7.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案的雙音節簡碼由組詞漢字拼音字首組成,和由組詞漢字的拼音字首加序號組成。
8.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案的三音節詞碼由組詞漢字拼音字首組成,由組詞漢字拼音字首加序號組成。
9.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案四音節詞碼由組詞漢字拼音字首組成,也可由組詞漢字拼音字首加序號組成。
10.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案五音節和五音節以上詞碼由組詞漢字「前三未一」拼音字首組成。
11.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案所說的詞是一般意義上的詞、也可以是短語、詞組,成語。
12.按照權利要求
1所述的中文聲數編碼方案,其特徵在於該方案為中文聲數編碼配製了鍵位圖。
13.按照權利要求
1所述的中文聲數編碼方案的鍵位圖,其特徵在於所說的鍵位圖確定現代漢語實用聲、韻母。
14.按照權利要求
1所述的中文聲數編碼方案的鍵位圖,其特徵在於所說的鍵位圖確定實用聲、韻、母的鍵位。
15.按照權利要求
1所述的中文聲數編碼方案的鍵位圖,其特徵在於所說的鍵位圖利用聲、韻、兩鍵位確定音節的雙拼規律和聲、韻、調順序識別的原則。
16.根據權利要求
1所述的中文聲數編碼方案的鍵位圖,其特徵在於該鍵位圖利用互補互斥規則設計鍵盤。
17.根據權利要求
1所述的中文聲數編碼方案的鍵位圖,其特徵在於該鍵位圖設計了漢語的常用標點符號。
18.一種中文聲數編碼方案的實現方法,其特徵在於所述的實現方法,利用一級簡碼字、二級簡碼字、三級簡碼字的分層提示方法。
19.根據權力要求18所述的一種中文聲數編碼方案的實現方法,其特徵在於該方法利用屏幕上漢語拼音顯示和提示。
專利摘要
《中文聲數編碼》方案及其實現方法。中文聲數編碼為解決中文信息處理技術中的「瓶頸」問題,提出了一種先進的漢字編碼方案。編碼規則簡明,易學、易用,不需專門記憶;明碼可讀,無重碼,適於聽打、盲打;可使語言思維和漢字鍵入溶為一體,容易普及,中文聲數編碼方案在計算機上的實現方法提出了一種很好的方法。此方法適用於中文聲數編碼和其它具有簡碼的漢字輸入編碼,使得簡碼的使用進入實用階段,中文聲數編碼方案及其實現方法,可以使計算機成為中、小學學生及外國人學習漢語(字)的現代化的教具之一。
文檔編號G06F3/023GK85100087SQ85100087
公開日1986年7月30日 申請日期1985年4月1日
發明者唐懋寬, 楊春武 申請人:清華大學導出引文BiBTeX, EndNote, RefMan

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀