漢字筆形筆順二進位編碼法的製作方法
2023-08-05 01:33:46 1
專利名稱:漢字筆形筆順二進位編碼法的製作方法
技術領域:
本發明涉及漢字編碼,尤其涉及漢字筆形筆順二進位編碼。
現有漢字查字法可歸納成三類字形法、字音法和音形法。字音法,以漢語拼音法為佳,但離開了字音就沒法查字,故一般還附有字形查字法;音形法也依賴字音,無字音也無法查字;字形法以部首法為佳,但部首歸類不同,部首法就有多種,使用時,先得按其規定,找準這字的部首,數出筆劃數,找到這個部首,再數出其筆劃數,在幾個或幾十個同筆劃數的字中,按其筆形排列方法找到這個字,給使用者帶來一定困難和不便。
本發明目的是提供一種新的漢字編碼法即漢字筆形筆順二進位編碼法,既簡便、又快捷,且可用於電子計算機進行漢文字處理。
本發明的目的是這樣實現的將漢字筆形分解,按漢字筆劃書寫順序(筆順)編碼,然後以一定規則排列。漢字筆形包括復筆和鉤筆分解歸納成橫筆和豎筆兩種,分別用阿拉伯字母1和0作代號,橫筆代號為「1」,豎筆代號為「0」,然後按漢字筆劃書寫順序作二進位編碼。對每個漢字則按其編碼大小次序進行排列,對同碼的漢字,其排列原則左右結構在前;筆劃相接或交叉少的在前;筆形短的在前。對筆劃數在4筆和4筆以上的漢字在上述二進位編碼的基礎上進行再編碼,其方法是用十六個英文字母A、B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R作代碼,每一英文字母代碼代表一組由四位二進位數字的代號。用英文字母再編碼時,若剩餘數字代號不足四位時,仍保留該上述數字代號於英文字母代碼之後。若漢字筆劃超過十六筆,即其二進位編碼超過十六位時,取前十二位和末四位二進位編碼轉換成上述英文字母代碼。
下面結合實施例作進一步說明。
二進位編碼超過十六位時的再編碼鄜1101,0001,0110,111,0010PBGC飈0100,0010,1011,10011001,1001ECMK三、漢字排列(1)按編碼數字從小到大或英文字母順序排列(2)對同碼漢字排列①形碼全同,如「吧」和「邑」代碼同為LF101,均由「口」和「巴」兩部分組成。按左右結構排列在前原則,「吧」在先、「邑」在後。
②代碼相同,如「八」、「入」和「人」代碼均為01,「八」筆劃無相接或交叉排在最先、「入」的首筆較「人」的首筆短,排在其次。
這種漢字筆形筆順二進位編碼法,以見字定號,同時編碼,簡便、快捷,對繁複漢字在二進位基礎上,可以進行再編碼。這種方法可用於編輯詞典、電話查閱冊及各種文字檔案管理,還可輸入電腦進行漢文字處理。
權利要求
1.一種包含筆形代號的漢字筆形筆順二進位編碼法,其特徵是將漢字筆形包括復筆和鉤筆分解成橫筆和豎筆兩種,並分別用阿拉伯字母1和0作其代號,橫筆代號為「1」,豎筆代號為「0」,每一漢字按其筆劃書寫順序作二進位編碼,漢字的編排按其編碼大小次序進行排列。
2.根據權利要求1所述的漢字筆形筆順二進位編碼法,其特徵是在上述二進位編碼基礎上,以二進位四個代號為一組,用十六個英文字母作代號進行再編碼A 0000; E 0100; J 1000; N 1100;B 0001; F 0101; K 1001; P 1101;C 0010; G 0110; L 1010; Q 1110;D 0011; H 0111; M 1011; R 1111。
3.根據權利要求1或2所述的漢字筆形筆順二進位編碼法,其特徵是當所述的二進位編碼超過十六位時,取前十二位和末四位二進位編碼用所述的英文字母代號進行再編碼。
4.根據權利要求1所述的漢字筆形筆順二進位編碼法,其特徵是對同碼漢字排列按下列原則進行①形碼全同的,左右結構排列在前;②形狀不同代碼全同的,接叉無、少排列在前;③筆形短的,排列在前。
全文摘要
一種漢字筆形、筆順二進位編碼法,提供了新的編制詞典方法。查閱起來簡便、快捷。其特徵是將漢字筆形包括復筆和鉤筆分解成橫、豎兩種,用阿拉伯字母1和0定號,橫筆代號為「1」,豎筆代號為「0」,然後按漢字筆劃書寫順序進行編碼或再編碼,對編碼大小按次序進行排列。使用這種方法,可推動漢字筆序、筆形規範化;又可輸入電腦進行漢文字處理。
文檔編號G06F3/023GK1085669SQ9210860
公開日1994年4月20日 申請日期1992年10月10日 優先權日1992年10月10日
發明者鄭福根 申請人:鄭福根