一種計算機漢語輸入編碼方法
2023-07-27 21:45:46 2
專利名稱:一種計算機漢語輸入編碼方法
計算機漢語輸入和編碼是實現漢語處理信息化的關鍵環節,長期以來人們研究開發了很多種漢字編碼方法,它們各有特色,有的輸入速度快,有的易學,但易學和速度快是一對矛盾,輸入速度快就不易學,易學了就輸入速度慢本發明的目的在於提供一種計算機漢語輸入編碼方法,有效地解決易學與速度之間地矛盾,既易學易用,又保持較高地漢語輸入速度。
為實現上述目的,本發明採用的技術方案為一種計算機漢語輸入編碼方法,是利用計算機鍵盤上的26個英語字母和10個數字鍵碼以及「-、=、[、]、/」符號鍵碼作為基本碼元進行編碼並輸入漢語的方法,單字編碼由三個碼元組成,即由漢字的漢語拼音中的第一個字母和漢字的首部碼及其尾部碼組成,四個或四個以上的漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字的漢語拼音中的第一個字母和詞組中的最後一個漢字的漢語拼音中的第一個字母組成,三個漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字的漢語拼音中的第一個字母和組成第三個漢字的首部碼組成,二個漢字組成的詞組的編碼由詞組中第一、第二個漢字的漢語拼音中的第一個字母和組成第一個漢字的首部碼、以及組成第二個漢字的首部碼組成。首部碼和尾部碼是代表組成漢字的偏旁部首等的最小部件,並將一些不能成為一個獨立漢字的偏旁部首分布在10個數字鍵和26個英文字母以及「-、=、[、]、/」符號鍵上(「-、=、[、]、/」符號鍵僅作為特定字的首部碼),它們所對應的鍵碼就是漢字的首部碼或尾部碼,對一些沒有分布在10個數字鍵和26個英文字母鍵以及「-、=、[、]、/」符號鍵上的部首則取其所能組成的最小的漢字的漢語拼音中的第一個字母作為其首部碼或尾部碼。
漢語中的一個句子多數是由若干個詞組組成,其中不能構成詞組的單字卻很少,同時本發明用26個英語字母和10個數字鍵碼以及「-、=、[、]、/」符號鍵碼為基本碼元,其組成的編碼量很大,因此,本方案中的詞庫中儲存著大量的詞組,且使用時遵循最大化原則,即能用詞組儘量用詞組輸入,能用大詞組儘量用大詞組輸入。這樣可以大大提高漢語輸入速度,為信息的高速處理提供有效的方法。
下面通過實施例並通過附圖進一步說明本發明
圖1為漢語詞組編碼結構示意2為特殊部首鍵盤分布示意3為常用單字鍵盤分布示意圖實施例如圖1所示,單字編碼由三個碼元組成,即由漢字的漢語拼音中的第一個字母和漢字的首部碼及其尾部碼首部組成,如「常」字,其編碼為「C3J」,四個或四個以上的漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字和詞組中的最後一個漢字的漢語拼音中的第一個字母組成,如,「漢字輸入」一詞的編碼為「HZSR」,三個漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字的漢語拼音中的第一個字母和組成第三個漢字的首部碼組成,如,「電話機」一詞的編碼為「DHJM」,二個漢字組成的詞組的編碼由詞組中第一、第二個漢字的漢語拼音中的第一個字母和組成第一個漢字的首部碼以及組成第二個漢字的首部碼組成,如,「原理」一詞的編碼為」YLCW」。首部碼是一個漢字的前幾筆所構成的但構不成一個單獨漢字的偏旁部首所對應的鍵碼或一些簡單的漢字的漢語拼音中的第一個字母,這些特殊的、不具有一個單獨意義的漢字部首,如,艹、氵、扌、勹、亠等等,則將其分布在特定的碼鍵上,如圖2所示,本實施例中,歸納出一些常用的偏旁部首,並將其分布在10個數字鍵和26個字母鍵上,使用時,它們所對應的數字或字母就作為它們的碼元,且在編碼時優先使用。如,「編碼」一詞的編碼為「BM51」、「詞組」一詞的編碼為「CZP5」、「衣服」一詞的編碼為「YF6Y」。在編碼時,遇到獨體字,它的部首碼就是該漢字的第一個筆劃所對應的鍵碼(見圖2中6、1、I、8、U、A、L所代表的筆劃),如,「無線電」一詞的編碼是「WXDI」。獨體字在單字輸入時其首部碼就是該漢字的第一筆劃筆劃所對應的鍵碼,其尾部碼是其最後一筆筆劃所對應的鍵碼,如「為」字的首部碼為A,尾部碼是6,「生」字其首部碼為U,尾部碼是1。
漢語中的一個句子多數是由若干個詞組組成,為了方便,同時優選若干個不易組詞且使用頻率高的單字分布在26個字母鍵和10個數字鍵以及「-、=、[、]、/」符號鍵上,其編碼為該字所在鍵的鍵碼,如圖3所示,使用時,只需敲擊鍵盤上該字所對應的鍵再加空格鍵即可。
權利要求
1.一種計算機漢語輸入編碼方法,是利用計算機鍵盤進行編碼並輸入漢字的方法,其特徵在於用26個英語字母和10個數字以及「-、=、[、]、/」符號鍵碼為基本碼元,單字編碼由三個碼元組成,即由漢字的漢語拼音中的第一個字母和漢字的首部碼及其尾部碼組成,四個或四個以上的漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字的漢語拼音中的第一個字母和詞組中的最後一個漢字的漢語拼音中的第一個字母組成,三個漢字組成的詞組的編碼由詞組中第一、第二、第三個漢字的漢語拼音中的第一個字母和組成第三個漢字的首部碼組成,二個漢字組成的詞組的編碼由詞組中第一、第二個漢字的漢語拼音中的第一個字母和組成第一個漢字的首部碼以及組成第二個漢字的首部碼組成。
2.根據權利要求1所述的計算機漢語輸入編碼方法,其特徵在於 首部碼和尾部碼是組成漢字的偏旁部首等最小部件所對應的鍵碼,將一些不能成為一個獨立漢字的偏旁部首分布在10個數字鍵和英文字母以及「-、=、[、]、/」等符號鍵碼鍵上,它們所對應的鍵碼就是漢字的首部碼或尾部碼,對一些沒有分布在10個數字鍵和英文字母鍵以及「-、=、[、]、/」符號鍵碼上的部首則取其所能組成的最小的漢字的漢語拼音中的第一個字母作為其首部碼或尾部碼,獨體字的首部碼是該漢字的第一筆劃筆劃所對應的鍵碼,其尾部碼是其最後一筆筆劃所對應的鍵碼。
全文摘要
本發明為一種計算機漢字輸入編碼方法,是利用計算機鍵盤的上的26個英語字母和10個數字以及「-、=、[、]、/」符號鍵碼作為基本碼元,單字編碼由三個碼元組成,即由漢字的漢語拼音中的第一個字母S
文檔編號G06F3/023GK1376966SQ0210829
公開日2002年10月30日 申請日期2002年3月28日 優先權日2002年3月28日
發明者曹湖海, 王學雲, 孫玉華 申請人:孫玉華