新四季網

漢字筆畫字母編碼法的製作方法

2023-04-28 01:39:31

專利名稱:漢字筆畫字母編碼法的製作方法
技術領域:
本發明涉及一種按照漢字筆畫形狀及其書寫順序(筆順)進行編碼的方法,包括一套漢字筆畫字母的建立,以及使用此筆畫字母對漢字按其筆畫書寫順序(筆順)進行編碼的方法。
目前在計算機應用及信息技術的發展中出現了大量的漢字編碼方法,種類很多,各有其特長和不足,但是尋求一種既簡單易學,又編碼及輸入速度不太慢,重碼率不太高,有相當的實用價值既符合西方文字按字母拼寫鍵盤輸入的普遍方式,又不脫離中國漢字發展的傳統規律的漢字編碼方法仍然為社會所期望。本發明中所建立的方法即是為尋求此目的所作研究的一個結果。
為使漢字能夠達到像西方文字一樣從外觀上有一目了然的確定性很強的構成文字的有序的單元(字母),較簡單的方法就是利用漢字的單筆筆畫這一漢字的天然字母,它在字中如同西文的字母一樣是呈有序的排列(按筆順),但是它的實際形狀數量太多,而對它的歸類又過於概括數量太少。若能將其合理而又明確地歸納為適宜的規範化的種數,則可起到如西文中字母所起的相應的作用。
本方法中創造了一套漢字筆畫字母,其所遵循的原則為1.以傳統的漢字筆畫為基礎,從中選擇歸納,歸納中注意其確定性;
2.採用英文的26個字母為代碼,使漢字筆畫的歸結數量亦為26個;
3.代碼與筆畫搭配時考慮到英文字母在鍵盤上的位置,以便於筆畫字母的記憶和使用操作。
以下列出本發明的26個筆畫字母的代碼字母、典型筆畫、筆畫名稱,歸類筆畫及有關說明代碼字母及典型筆畫 筆畫名稱、歸類筆畫及說明a 一 -橫b 丨 -豎c 丶 -點.含 (憶)d -提.含 (蟲)e 丿 -撇f -撇折,含 (東)g -豎折,含 (互) (牙) (二折者以首折計)h -豎彎鉤,含 (幾) (殳) (西) (心)乙i -橫撇,含 (專)j -橫折,含 (互) (凹)(二折者以首折計)k -橫折鉤,含 (永)l ㄋ -三折,含ㄋ(乃) (廷) (邊) (凸)m -捺,含 (邊)n -斜鉤o 乛 -橫鉤p 亅 -右豎鉤,含 (狂), (了)q -左豎鉤,含 (計)
r 丿 -豎撇,屬r不屬e的丿定義為①字或部左側通筆撇(月廠反)②與豎或豎鉤並立者(介帥頑)③與 並立者(兒刀乃)④穿橫上出者(大右)⑤簡體貫中撇(貝見)⑥點後靠撇(班火)s ㄑ -撇點t -二或多交叉的橫或豎(不管端接如何)(廿豐)u -一端與另一筆畫端接成直拐角的橫(廠)v -一端與另一筆畫端接成直拐角的豎(貝)w -二端與另二筆畫端接成直拐角的橫(口)x -二端與另二筆畫端接成直拐角的豎(口)y -單交叉的橫(不管端接如何)(十中)z -單交叉的豎(不管端接如何)(十冉)在26個筆畫字母中排於最後的t至z的7個字母為具有表達筆畫間關係的關係筆畫字母,用之可將漢字中的橫及豎筆畫進一步加以明確地細分。
附圖
是26種筆畫在鍵盤上的位置圖,其中標出了各字母以其所表示的典型筆畫的鍵盤位置。如前所述各種筆畫在鍵盤上的分布位置考慮到了記憶和使用操作的方便性,這具體表現在1.把鍵盤的範圍視作一個漢字方塊,使各類筆畫儘量接近其在字中的常見位置,如左豎鉤在左端,橫鉤、右豎鉤及三折在右端,捺及斜鉤在右下
2.折筆在中部,左折的靠左,右折的靠右;
3.橫筆靠上,豎筆在下;
4.撇、豎撇及提集中在一起。
在實際使用中典型筆畫是不必標記在字母鍵上的,因為它以英文字母為明確的表示,是易於記熟的。
使用上述的漢字筆畫字母就可以按照漢字的筆順對每個漢字進行編碼,這樣的編碼是合乎中國漢字傳統文化習慣的一種發展。但是每個漢字筆畫有多有少,有些甚至多達二三十筆,用多少筆畫來確定一個漢字最為合適呢?筆畫用得越多則確定性越高,亦即重碼率越低,但是隨之其編制和使用操作也會越不方便。通過分析研究,發現採取首2碼加尾3碼的5碼制較為適宜,它包括字首的信息及字尾的信息,二者結合起來就可以有足夠的信息來較好地確定各個漢字,使重碼率下降到不太高的程序,而在碼的編制和使用操作中又不至於太長太慢。
具體的編碼規則為1.對一切漢字不論簡體或繁體均按其筆畫的書定順序(筆順)用筆畫字母進行編碼;
2.對每字取其首2筆碼+尾3筆碼按順序排成5位碼作為該字的編碼;
3.對少於5筆的字按前位優先的原則取碼直至末筆,不足的碼位均在最後留空,構成1~4位的編碼。
舉例例字-中 華 人 民 共 和 國對應編碼-xjyt ebhyz em juqyn tzaec eyxjw xjacw
對GB2312-80所收的6763個字進行編碼時,按字母排列後的a部共包括467個字,出現重碼114個,其中單重(二字同碼)的47組,多重的20組,最多的一組重碼為8重,此部分的重碼率為24.4%。
此基本編碼法的重碼率不太高,而方法極為簡單且很規範化,可適用於漢字的手工檢索系統(字辭典、資料庫)的編碼及速度要求不很高的計算機及信息系統的輸入編碼。
以漢字筆畫字母基本編碼法為基礎,輔助以一些特首部及特尾部碼的減重碼作用,使編碼結果的重碼率降到很低,從而提高向計算機及信息系統輸入的效率的方法為提高編碼法。
提高編碼法的具體方法包括1.按照對減低重碼所起作用的程序對漢字中字首及字尾上常出現的偏旁部首加以選擇,取其影響程度較大的20個字首上的定為特首部,28個字尾上的定為特尾部;
2.每一特首部或特尾部均以其所包含(少數為間接包含)的一個代表性筆畫的筆畫字母為代碼,在字的編碼中使用時相當這個單筆畫的筆畫字母的作用;
3.特首部只在字的最開始成立,其後無筆畫時亦不能成立特尾部只在字的最末尾成立,並且其前至少有一單筆畫碼尾碼存在時該特尾部方可成立,特首部或特尾部在符合條件時必須使用4.特首部碼及特尾部碼在字的編碼中與單筆畫碼混合使用,對每字取首2筆碼+尾3筆碼按筆順排成5位碼作為該字的編碼,碼長不足5位時按前位優先的原則取碼,不足碼位的最後留空。
以下列出所使用的20個特首部及其代碼以及一些必要的說明特首部及代碼 說明口 x -口內無筆畫 j -口內有筆畫,口後如有筆畫則接口後第一筆編碼,否則接口內第一筆編碼月 k氵 d火 r -不含火十 y木 z -不含木扌 p亻 b女 s釒 q -含 旁,不含金魚 i -含魚旁,不含魚疒 u宀 o艹 t f -取首2筆連筆作為 (撇折)取碼蟲 g -取第4.5筆連作為 (豎折)取碼糹 l -取首2筆連筆作為 (三折)取碼訁 w -取言之末筆碼,含言旁忄 h -取心之第2筆碼
20個特首部中最後5個是間接包含代表性筆畫。
以下列出28個特尾部及其代碼以及一些必要的說明特尾部及代碼 說明日 j -含曰月 k -含月頁 j -含貝、 皿 b口 x -只含口內無筆畫者大 r -含橫以上有重交叉者(如夫中之大),不含 小 p -含上部有交叉者(如 中之小)火 r -不含火寸 p亍 p土 y -含士木 z -含米中之木,不含 未 t -含未、果等中之木,即橫以上有重交叉之木 t -含牛、羊、甲中之 ,不含豐辛 z兒 r -含幾、凡女 s鳥 k -含 衣 q -含
心 h e -含 ,不含業金中之 及只中之 辶 l攵 m -含文,不含 戈 n -含橫筆後有夾筆者,此時橫筆作特尾部外筆畫止 b三 a彡 e灬 c由於所使用的特首部及特尾部數量不多(合計48個),所以不必強記,只需稍加熟悉即可在編碼中見字識出所遇到的特首部或特尾部。又由於其代碼為所包含的一代表性筆畫的筆畫字母,所以不必強記即可從字面上直觀地讀出所遇到的特首部或特尾部的代碼。舉例例字——坊枋 耐礙 嘹瞟基本法編碼——yzakr aeypc xjpec提高法編碼——ydakrzcakr aebbpaewapxyawpjaaap對GB2312-80所收的6763個字進行編碼時,按字母排列後共出現397個重碼,其中大多數為單重(二字同碼),小部分為兩重(三字同碼),更多重者沒有,總計重碼率為5.87%。
提高編碼法由於重碼率達到很低,所以編碼的輸入操作效率可以大為提高,而方法仍很簡單,故適用於廣泛的計算機及信息系統的輸入編碼。
權利要求
1.一種按照漢字筆畫形狀及其書寫順序進行漢字編碼的方法,其特徵是將漢字筆畫細分為26種,每種固定地以26個英文字母中一個作為其代碼,成為漢字筆畫字母,使用這些筆畫字母對漢字只按照其單筆筆畫的書寫順序進行編碼的漢字筆畫字母基本編碼法,以及加入特首部及特尾部的輔助減重碼作用進行編碼的漢字筆畫字母提高編碼法。
2.根據權利要求1所述的漢字編碼的方法,其特徵為具有一套漢字筆畫字母,它是用26個英文字母分別表示以下對應的漢字筆畫a-橫一f撇折レl-三折ㄋr-豎撇丿b-豎丨g-豎折 m-捺 s-撇點 c-點丶h-豎彎鉤しn-斜鉤 d-提 i-橫撇 o-橫鉤 e-撇丿j-橫折 p-右豎鉤 k-橫折鉤 q-左豎鉤 t-二或多交叉的橫或豎(不管端接如何)艹 u-一端與另一筆畫端接成直拐角的橫 v-一端與另一筆畫接成直拐角的豎 w-二端與另二筆畫端接成直拐角的橫 x-二端與另二筆畫端接成直角拐角的豎 y-單交叉的橫(不管端接如何) z-單交叉的豎(不管端接如何) 其中t→z 7個筆畫字母具有表達筆畫間關係的性質。
3.根據權利要求1所述的漢字編碼的方法,其特徵在於按照以下的方法進行編碼的漢字筆畫字母基本編碼法(1)對一切漢字不論簡體或繁體只按照其筆畫的書寫順序用筆畫字母進行編碼;(2)對每字取其首2筆碼及尾3筆碼按順序排成5位碼作為該字的編碼;(3)對少於5筆的字,按前位優先的原則取碼,不足碼位在最後留空,構成1~4位的編碼。
4.根據權利要求1所述的漢字編碼的方法,其特徵在於按照以下方法進行編碼的漢字筆畫字母提高編碼法(1)按照對減少重碼所起作用的程序對漢字字首及字尾上常出現的偏旁部首加以選擇,取其影響程度較大的20個字首上的定為特首部,28個字尾上的定為特尾部;(2)每一特首部或特尾部均以其所包含(直接或間接包含)的一個代表性筆畫的筆畫字母為代碼,在字的編碼中使用時相當於這個單筆畫的筆畫字母的作用;(3)特首部只在字的最開始成立,其後無筆畫時亦不能成立;特尾部只在字的最末尾成立,並且在其前至少有一單筆碼尾碼存在時該特尾部方可成立;(4)在字的編碼中特首部碼及特尾部碼與單筆碼混合使用,對每字取首2筆碼及尾3筆碼按筆順排成5位碼作為該字的編碼,碼長不足5位時按前位優先的原則取碼,不足碼位在最後留空,構成1~4位的編碼。
全文摘要
本漢字筆畫字母編碼法為一種按筆畫形狀及筆順對漢字編碼的方法。它包括一套有26個字母的漢字筆畫字母的建立及用此筆畫字母對漢字按筆順編碼的基本及提高編碼法。基本法只使用單筆筆畫字母,方法極為簡單又規範化,重碼率也不很高,適於漢字手工檢索系統編碼及對速度要求不很高的信息系統輸入編碼;提高法藉助特首部及特尾部碼的降重碼作用使重碼率達到很低,方法仍很簡單,適於速度要求較高的信息系統輸入編碼。
文檔編號G06F3/023GK1110803SQ9410348
公開日1995年10月25日 申請日期1994年4月18日 優先權日1994年4月18日
發明者麻福武 申請人:麻福武

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀